=ELK: Elasticsearch (conceptos)
== indice
  * colección de documentos con características similares
  * identificado por un nombre (minúsculas)

== documento
  * unidad básica de información
  * formato JSON
  * en un índice se almacenan todos los documentos que queramos

== shards
  * paquetizar y distribuir la información (indice) entre los nodos
    * permite subdividir/escalar la información almacenada
    * paralelización operaciones


== réplica
  * permite réplicas de los shards
  * HA
  * paralelización operaciones en las réplicas
  * cada índice tiene shard primario y réplicas
  * 2.174.000.000 documentos por shard
  * los shards no se pueden modificar, las réplicas si

== BDD distribuida
  * información almacenada entre los nodos
  * transparente para el usuario
  * independencia OS
  * procesamiento distribuido de consultas
  * información fragmentada
  * HA

== tipos de nodos
  * instancia elasticsearch = nodo
  * interconectados, cluster
  * peticiones HTTP REST API
  * comunicación interna
=== Master Node
  * crear/borrar índices
  * nodos que forman parte del cluster
  * decide que nodo aloja cada shard
  * indexado de búsqueda de datos: CPU, RAM, I/O
  * buena práctica: master dedicado.

=== Data Node
  * almacenan los shards
  * operaciones: CRUD, búsquedas, agregaciones
  * importante monitorizar CPU, RAM, I/O
  * añadir más datanodes si se sobrecargan para balancear procesamientos y reparto de datos

=== Ingest Node
  * pre-procesamiento de la información entrante antes de su indexado
  * buena prácica: ingest dedicados
  * equivalente logstash

=== Coordinating Node
  * encaminar peticiones, respuestas de búsquedas, distribuir indexados -> balanceador de carga inteligente
  * ayudan a descargar la tarea de coordinación de los Master Nodes
  * usan el estado del cluster para encaminar búsquedas y peticiones allá donde toque

{{:info:cursos:openwebinars:elk:pasted:20211129-104658.png}}
{{ :info:cursos:openwebinars:elk:1.1_introduccion_elasticsearch.pdf |}}