agri1.ai: A Two-Sided Approach to LLMs, chatGPT in Agriculture - Frontend & Embedding and Domain-Specific Large Language Model for Agriculture

Bienvenidos al mundo de las LLMS como Claude, Llama y chatGPT en la agricultura, bienvenidos a agri1.ai, una iniciativa que pretende explorar el potencial de la inteligencia artificial (IA) en la industria agrícola. A medida que la población mundial sigue creciendo, la demanda de prácticas agrícolas eficientes y sostenibles es más acuciante que nunca. La IA, con su capacidad para analizar grandes cantidades de datos y hacer predicciones precisas, podría cambiar las reglas del juego para satisfacer esta demanda.

Introducción
Estado actual de agri1.ai
El futuro de agri1.ai y el modelo de gran lenguaje específico para la agricultura
LLM Enfoques y modelos de código abierto
LLMs existentes en Agricultura

Introducción

Con agri1.aiestamos adoptando un enfoque doble para aprovechar el poder de la IA en la agricultura. Por un lado, desarrollamos una interfaz que utiliza un modelo de lenguaje amplio (LLM) existente, lo perfeccionamos, lo integramos y lo contextualizamos con datos públicos e internos. Por otro lado, estamos explorando la posibilidad de crear nuestro propio LLM específico para la agricultura.

En entornos que cambian rápidamente, tanto en términos climáticos como de mercados, el concepto de agri1.ai adquiere cada vez más importancia. Esto es especialmente cierto en el caso de las grandes sociedades impulsadas por la agricultura y en regiones como el continente africano, donde la falta de conocimientos puede dar lugar a importantes retos dentro de la agricultura. Una de las misiones de agri1.ai es abordar estos problemas, apoyando a los pequeños agricultores en su lucha contra unas condiciones climáticas que cambian con rapidez, y ofreciendo una mejor consulta para los nuevos cultivos agrícolas en función de las condiciones climáticas y del suelo. La falta de educación en ciertas partes del mundo es también una motivación para que apoyemos a los agricultores a través de nuestra iniciativa.

El estado actual de agri1.ai: salvar la brecha entre los humanos y la IA

En el centro de nuestra iniciativa, agri1.ai sirve de plataforma dinámica, tendiendo un puente entre los humanos en la agricultura y el mundo del software y los algoritmos de IA. Nuestro principal objetivo es facilitar una interacción fluida entre estas dos entidades, fomentando una relación simbiótica que mejore la eficiencia y la sostenibilidad de las prácticas agrícolas.

Actualmente, a gri1.ai funciona sobre la base del GPT de OpenAI, un modelo de lenguaje de gran tamaño (LLM) de última generación. Hemos adaptado y perfeccionado parcialmente este modelo para comprender y generar mejor textos centrados en la agricultura, mejorando su relevancia y utilidad para nuestros usuarios. Además, hemos incorporado parcialmente datos integrados, tanto públicos como internos, para aumentar la comprensión contextual del modelo en el ámbito agrícola.

En el ámbito de la IA, la simplicidad es a menudo la clave del éxito. Crear e implantar aplicaciones de IA puede ser un proceso complejo, y mantener la sencillez en nuestras operaciones nos permite centrarnos en ofrecer un servicio de alta calidad y fácil de usar. Al basarnos en un LLM alojado ya existente, podemos aprovechar la potencia de la IA avanzada y, al mismo tiempo, mantener un sistema ágil y eficiente.

Una de las piedras angulares de nuestro funcionamiento es la gobernanza de los datos. Reconocemos la importancia crítica de gestionar la disponibilidad, usabilidad, integridad y seguridad de los datos de nuestros usuarios. Este enfoque integral de la gobernanza de datos no sólo garantiza la fiabilidad y utilidad de la información proporcionada por agri1.ai, sino que también aborda preocupaciones clave como el cumplimiento de la normativa, la privacidad, la calidad y la seguridad. Entendemos que las agroindustrias tengan preocupaciones válidas sobre la fuga de datos y la posibilidad de que los LLM se formen con datos internos, comprometiendo la soberanía de los datos. Queremos asegurar a nuestros usuarios que nos tomamos muy en serio estas preocupaciones y que estamos trabajando activamente en estrategias para abordar estas cuestiones.

Mientras seguimos perfeccionando y mejorando agri1.ai , también estamos explorando la posibilidad de crear un nuevo LLM mediante el reentrenamiento o la puesta a punto de un LLM existente. Este enfoque podría permitirnos crear un modelo más especializado y eficaz para la agricultura.

El futuro de agri1.ai: Modelo de gran lenguaje específico para la agricultura

Aunque estamos orgullosos de lo que hemos conseguido hasta ahora con agri1.ai, no nos detenemos ahí. También estamos explorando la posibilidad de crear nuestro propio LLM específico para la agricultura. Este modelo, al que llamamos agriLLM (título provisional), se entrenaría con una gran cantidad de datos de texto relacionados con la agricultura, lo que lo convertiría en un experto en el lenguaje y los matices de la industria agrícola.

La creación de agriLLM será un proceso complejo que implicará la recopilación de datos, su limpieza y preprocesamiento, la selección del modelo, su entrenamiento, su puesta a punto, su evaluación y prueba, y su despliegue. También estamos planeando involucrar a expertos en diversos campos de la agricultura para que nos ayuden a construir conjuntos de datos de entrenamiento detallados y a afinar el modelo.

Recogida de datos: El primer paso en la construcción de un LLM específico para la agricultura consiste en recopilar una gran cantidad de datos relevantes para el campo. Puede tratarse de artículos científicos, trabajos de investigación, guías agrícolas, informes meteorológicos, datos sobre el rendimiento de las cosechas y mucho más. Los datos deben abarcar una amplia gama de temas relacionados con la agricultura para garantizar que el modelo sea completo y conozca todos los aspectos de este campo. Para automatizar el proceso de recopilación de datos de diversas fuentes en línea pueden utilizarse herramientas como el web scraping.
Preprocesamiento de datos: Una vez recogidos los datos, hay que preprocesarlos para prepararlos para el entrenamiento del LLM. Esto implica la limpieza de los datos (eliminación de duplicados, corrección de valores omitidos o incorrectos), normalización (conversión de todo el texto a minúsculas, eliminación de signos de puntuación y palabras vacías) y tokenización (descomposición del texto en palabras o frases individuales para crear el vocabulario del modelo lingüístico).
Selección y configuración de modelos: El siguiente paso consiste en elegir una arquitectura de modelo adecuada para el LLM. Los modelos basados en transformadores, como GPT-3 y BERT, son opciones populares debido a su capacidad para manejar largas secuencias de texto y generar resultados de alta calidad. En esta fase hay que especificar la configuración del modelo, incluido el número de capas, las cabezas de atención, la función de pérdida y los hiperparámetros.
Formación de modelos: A continuación, el modelo se entrena con los datos preprocesados. Para ello, se presentan al modelo secuencias de palabras y se le entrena para que prediga la siguiente palabra de la secuencia. El modelo ajusta sus ponderaciones en función de la diferencia entre su predicción y la siguiente palabra real. Este proceso se repite millones de veces hasta que el modelo alcanza un nivel de rendimiento satisfactorio.
Evaluación y puesta a punto: Tras el entrenamiento inicial, el modelo se evalúa en un conjunto de datos de prueba independiente. En función de los resultados de la evaluación, el modelo puede necesitar algunos ajustes. Esto podría implicar ajustar sus hiperparámetros, cambiar la arquitectura o entrenar con datos adicionales para mejorar su rendimiento.
Ajustes específicos de dominio: Para que el LLM sea específico de la agricultura, se perfecciona con los datos específicos del ámbito recogidos en la primera etapa. Esto ayuda al modelo a comprender la terminología, el contexto y los matices propios del sector agrícola.
Integración con agri1.ai: Una vez que el LLM específico del dominio está listo, se integra en el sistema agri1.ai. Esto implica establecer las API y las interfaces necesarias para que agri1.ai pueda aprovechar las capacidades del nuevo LLM.
Pruebas y comentarios de los usuarios: A continuación, los usuarios finales prueban el sistema agri1.ai actualizado. Sus comentarios se recogen y se utilizan para identificar cualquier problema o área de mejora.
Mejora continua: Basándose en los comentarios de los usuarios, el LLM se actualiza y mejora continuamente. Esto puede implicar más ajustes, añadir más datos al conjunto de entrenamiento o modificar la arquitectura del modelo.
Control y mantenimiento: Por último, el rendimiento del LLM se supervisa continuamente para garantizar que proporciona resultados precisos y útiles. También se realiza un mantenimiento periódico para que el sistema funcione sin problemas.

Construir un LLM específico para la agricultura es una tarea compleja pero factible. Implica una serie de pasos que van desde la recopilación de datos hasta la mejora continua. Siguiendo este proceso, pretendemos desarrollar un LLM que pueda proporcionar información precisa, relevante y útil a los usuarios de la industria agrícola.

Enfoques y modelos de código abierto

Seguimos de cerca la evolución de la comunidad de la IA en general. Un recurso que nos ha resultado especialmente útil es el Clasificación LMSYSque clasifica varios LLM en función de su rendimiento. Algunos de los modelos de esta clasificación, como GPT-4 de OpenAI y Claude-v1 de Anthropic, podrían servir de base para agriLLM.

Sin embargo, también somos conscientes de la brecha existente entre los modelos propietarios y los de código abierto. Aunque los modelos patentados, como GPT-4, lideran actualmente el grupo, somos optimistas sobre el potencial de los modelos de código abierto para alcanzarlos. Uno de estos modelos de código abierto es MosaicML, que ofrece una plataforma flexible y modular para modelos de aprendizaje automático y que podría utilizarse para entrenar nuestro propio LLM.

MosaicML ofrece una serie de características que podrían ser beneficiosas para el desarrollo de agriLLM. Permite entrenar modelos de miles de millones de parámetros en horas, no en días, y ofrece un escalado eficiente a gran escala. También ofrece mejoras automáticas del rendimiento, lo que permite a los usuarios mantenerse a la vanguardia de la eficiencia. La plataforma de MosaicML permite entrenar grandes modelos lingüísticos a escala con un solo comando, y ofrece reanudación automática en caso de fallos de nodos y picos de pérdidas, lo que podría ser especialmente útil para los largos tiempos de entrenamiento asociados a grandes modelos como agriLLM.

LLMs existentes en Agricultura

En nuestra investigación, hemos dado con un modelo específico para la agricultura, denominado AgricultureBERT, un modelo lingüístico basado en BERT que ha sido preentrenado a partir del punto de control de SciBERT. Este modelo se entrenó en un conjunto de datos equilibrado de trabajos científicos y generales en el ámbito de la agricultura, que abarca conocimientos de diferentes áreas de la investigación agrícola y conocimientos prácticos.

El corpus utilizado para entrenar AgricultureBERT contiene 1,2 millones de párrafos de la Biblioteca Nacional de Agricultura (NAL) del Gobierno de EE.UU. y 5,3 millones de párrafos de libros y literatura común del ámbito de la agricultura. El modelo se entrenó con el método de aprendizaje autosupervisado Masked Language Modeling (MLM), que consiste en enmascarar 15% de las palabras de la frase de entrada y hacer que el modelo prediga las palabras enmascaradas. Este método permite que el modelo aprenda una representación bidireccional de la frase, a diferencia de las redes neuronales recurrentes (RNN) tradicionales, que suelen ver las palabras una tras otra, o de los modelos autorregresivos como GPT, que enmascara internamente los tokens futuros.

Aunque este modelo existente puede proporcionar información valiosa y servir como punto de partida útil, nuestro objetivo final en agri1.ai es desarrollar nuestro propio LLM específico para la agricultura. Creemos que, de este modo, podremos crear un modelo aún más adaptado a las necesidades de la industria agrícola y que pueda proporcionar información aún más precisa y relevante a nuestros usuarios.

Keep It Agile: el viaje continúa

En el campo de la IA, en rápida evolución, el aprendizaje y la adaptación continuos son fundamentales. Este viaje ha sido una profunda experiencia de aprendizaje, sobre todo para mí, Max.

Comprender las formas únicas en que los usuarios interactúan con la IA en el contexto agrícola ha sido esclarecedor e instructivo. Cada consulta que recibimos de agricultores de todo el mundo nos proporciona información muy valiosa sobre los retos del mundo real que agri1.ai puede abordar. Nuestro enfoque es iterativo: observamos las interacciones de los usuarios, dialogamos con ellos, desarrollamos soluciones, las enviamos y volvemos a evaluarlas.

Este ciclo nos permite perfeccionar y mejorar constantemente nuestro producto, garantizando que siga siendo relevante y útil para nuestros usuarios. Estamos entusiasmados con el potencial de las mejoras de la interfaz de usuario (UI) y de la experiencia de usuario (UX) para mejorar aún más la usabilidad de agri1.ai . El ritmo de desarrollo de la IA es vertiginoso, con la aparición periódica de nuevos modelos y tecnologías. Nos comprometemos a estar al tanto de estos avances y a explorar cómo podemos aprovecharlos para mejorar agri1.ai y prestar un mejor servicio a los agricultores y las empresas agrícolas de todo el mundo.

Reconozco que esto es sólo el principio. El viaje de agri1.ai es un proceso continuo y me comprometo a seguir aprendiendo, adaptándome y mejorando. Me entusiasma el potencial de la IA para transformar la agricultura y agradezco la oportunidad de formar parte de este viaje. Gracias por acompañarnos en esta aventura.