En Elastic se esta constantemente innovando y lanzando nuevas características. A medida que se lanzo nuevas funciones, también se esta trabajando para asegurarnos de que sean probadas, sólidas y confiables, y a veces encontrando errores u otros problemas.
Al probar una nueva característica, se descubrio un error del kernel de Linux que afecta los discos SSD en ciertos kernel de Linux.
La investigación dio como resultado lanzamientos de nuevos núcleos de Ubuntu que abordan el problema.
Canonical se une al esfuerzo
Si bien habia algunas soluciones, todavía no estában satisfechos:
Para abordar estos puntos, nos comunicamos con nuestro socio Canonical para profundizar un poco más.
Canonical comenzó un gran esfuerzo de prueba utilizando los scripts de reproducción Elastic , primero confirmando que la corrupción no se produjo en los núcleos de línea principal de Ubuntu> = 5.0 usando unidades SSD (usando ninguno o planificadores de E / S de múltiples colas con fecha límite mq ).
El siguiente paso fue retroceder en las versiones de kernel para encontrar el delta mínimo entre un kernel que exhibe corrupción y uno que no. Utilizando múltiples entornos de prueba paralelos (dado que una prueba completa puede tomar hasta cinco días), Canonical descubrió que 4.19.8 es el primer núcleo de Ubuntu mainline que incluye las correcciones de corrupción [6].
Los backports faltantes para el kernel 4.15.0 y los derivados se describen en el rastreador de errores de Canonical en LP # 1848739 , y se pueden encontrar más detalles en este artículo y el error kernel.org .
Después de que Elastic y Canonical confirmaron que un kernel GCP parcheado que incluye todos los backports necesarios soluciona el problema , se fusionaron en el kernel principal de Ubuntu 4.15.0 y, en consecuencia, todos los kernels derivados (incluido -gcp) recibieron las correcciones.
Conclusión
Elastic se compromete a desarrollar nuevas características de Elastic Stack que mejoren cada una de las tres soluciones principales. Estos esfuerzos cuentan con el apoyo de algunos ingenieros y socios muy talentosos que siempre están atentos para que no tenga que preocuparse. Si encontramos problemas durante las pruebas, sepa que Elastic y su red de socios cercanos no dejarán ninguna piedra sin mover para garantizar que tenga la mejor experiencia posible.
A través de nuestra estrecha colaboración con Google y Canonical, se pudo llegar al fondo del problema, lo que condujo al lanzamiento de los siguientes núcleos fijos HWE Ubuntu:
linux-aws - 4.15.0-1061.65lanzado el 21 de febrero de 2020linux-azure - 4.15.0-1066.71lanzado el 6 de enero de 2020linux-gcp - 4.15.0-1053.57lanzado el 5 de febrero de 2020linux - 4.15.0-88.88lanzado el 17 de febrero de 2020El uso de las versiones anteriores o más recientes evitará la corrupción cuando se utilizan discos SSD junto con SCSI blk-mq habilitado.
Si no quiere preocuparse si su entorno está protegido de esta corrupción de datos, pruebe con Elastic Cloud.