ELK: Elasticsearch (conceptos)

  • colección de documentos con características similares
  • identificado por un nombre (minúsculas)
  • unidad básica de información
  • formato JSON
  • en un índice se almacenan todos los documentos que queramos
  • paquetizar y distribuir la información (indice) entre los nodos
    • permite subdividir/escalar la información almacenada
    • paralelización operaciones
  • permite réplicas de los shards
  • HA
  • paralelización operaciones en las réplicas
  • cada índice tiene shard primario y réplicas
  • 2.174.000.000 documentos por shard
  • los shards no se pueden modificar, las réplicas si
  • información almacenada entre los nodos
  • transparente para el usuario
  • independencia OS
  • procesamiento distribuido de consultas
  • información fragmentada
  • HA
  • instancia elasticsearch = nodo
  • interconectados, cluster
  • peticiones HTTP REST API
  • comunicación interna
  • crear/borrar índices
  • nodos que forman parte del cluster
  • decide que nodo aloja cada shard
  • indexado de búsqueda de datos: CPU, RAM, I/O
  • buena práctica: master dedicado.
  • almacenan los shards
  • operaciones: CRUD, búsquedas, agregaciones
  • importante monitorizar CPU, RAM, I/O
  • añadir más datanodes si se sobrecargan para balancear procesamientos y reparto de datos
  • pre-procesamiento de la información entrante antes de su indexado
  • buena prácica: ingest dedicados
  • equivalente logstash
  • encaminar peticiones, respuestas de búsquedas, distribuir indexados → balanceador de carga inteligente
  • ayudan a descargar la tarea de coordinación de los Master Nodes
  • usan el estado del cluster para encaminar búsquedas y peticiones allá donde toque

1.1_introduccion_elasticsearch.pdf

  • info/cursos/openwebinars/elk/elasticsearch/conceptos.txt
  • Darrera modificació: 29/11/2021 10:51
  • per mate