Elasticsearch Введение — 1.2 Взаимодействие

Взаимодействие с Elasticsearch

Основной способ взаимодействия с Elasticsearch — REST API. По умолчанию API — интерфейс Elasticsearch работает на порту 9200. Api можно классифицировать на следующие виды:

  • API документов: CRUD (Create Retrieve Update Delete) операции с документами
  • API поиска: поиск чего бы то ни было
  • API Индексов: управление индексами (создание, удаление …)
  • API Cat: вместо JSON данных возвращаются в табличном виде
  • API кластера: для управления кластером

Для каждого вида в дальнейшем будет отдельный урок. А сейчас мы рассмотрим некоторые основные CRUD операции API документов. Этот раздел представляет собой просто краткое введение о том, как управлять данными с помощью API документов. Кроме того стоит заметить, что есть клиентские библиотеки для большинства популярных языков программирования. По сути они являются оберткой вокруг REST API.

Для примера представим, что мы создаем интернет магазин. И хотим использовать Elasticsearch в качестве поиска. Мы будем использовать индекс с именем example1 и хранить все продукты  в типе product. Каждый продукт, который мы хотим индексировать, представляет собой JSON документ. И начнем с создания нового документа о продукте, затем запросим информацию о нем по его идентификатору, потом обновим данные в нем и в завершении удалим.

Создание документа

Новый документ можно добавить с помощью API документов. Например чтобы добавить новый товар можно выполнить следующий запрос. Тело запроса — это документ продукта, который мы хотим добавить.

Elasticsearch автоматически создаст индекс example1 и тип product если они еще не существуют.

В ответ на запрос выше мы получим следующее:

В ответе мы увидим, что Elasticsearch создал документ с версией 1 + доп информация о том куда добавился документ. Поскольку мы создали документа с использованием HTTP метода PUT нам необходимо было задать id документа иначе мы получим ошибку.

Если у вас нет уникального идентификатора, вы можете использовать HTTP POST тогда Elasticsearc создаст уникальный id за вас. Например:

Ответ:

Собственно вот и созданный id AV1hL8Dq3Zz-g306rrqI. Если попробовать сделать запрос PUT и передать уже существующий id, произойдет замена документа и увеличение параметра _version:

Как вы заметили created = false, а _version = 2.

Получение существующего документа

Чтобы получить документ нам надо знать индекс, тип и уникальный идентификатор документа. Попробуем получить недавно созданный документа с помощью следующего запроса:

Как видите результат содержит не только сам документ который храниться в полу _source, но и дополнительная информация, например что документ был найден found = true, текущая версия _version = 2 напомню, что она увеличивается каждый раз при изменении документа.

Обновление существующего документа

Обновление документов в Elasticsearch происходит сложнее, чем в традиционной SQL базе данных. За кулисами Elasticsearch происходит извлечение документа, применение изменений и следом повторная вставка документа. Очень дорогая операция.

Существуют разные способы обновление документа, подробно мы разберем эту тему на других уроках. А пока рассмотрим основы.

Частичное обновление документа

Давайте обновим категорию у недавно созданного документа:

«result»: «updated» значит все прошло успешно, заметьте _version тоже увеличилось. Доступны более сложные сценарии обновления, но как я уже говорил рассмотрим их позже.

 Удаление существующего документа

Для удаления существующего документа нам необходимо использовать HTTP метод DELETE передав в него путь, как для получения документа.

Ответ:

result = deleted, значит операция прошла успешно и документ был удален.