به دنیای LLMS مانند Claude، Llama و chatGPT در کشاورزی خوش آمدید، به agri1.ai خوش آمدید، ابتکاری که هدف آن کشف پتانسیل هوش مصنوعی (AI) در صنعت کشاورزی است. با ادامه رشد جمعیت جهان، تقاضا برای شیوه های کشاورزی کارآمد و پایدار بیش از هر زمان دیگری مبرم است. هوش مصنوعی با توانایی خود در تجزیه و تحلیل حجم وسیعی از داده‌ها و پیش‌بینی‌های دقیق، می‌تواند در برآورده کردن این تقاضا، تغییر دهنده بازی باشد.

معرفی
وضعیت فعلی agri1.ai
آینده مدل زبان بزرگ agri1.ai و دامنه خاص برای کشاورزی
رویکردها و مدل های منبع باز LLM
LLM های موجود در کشاورزی

معرفی

با agri1.ai، ما در حال اتخاذ یک رویکرد دو طرفه برای استفاده از قدرت هوش مصنوعی برای کشاورزی هستیم. از یک طرف، ما در حال توسعه یک رابط frontend هستیم که از یک مدل زبان بزرگ (LLM) استفاده می‌کند، آن را تنظیم می‌کند، آن را جاسازی می‌کند، و آن را با داده‌های عمومی و داخلی متن می‌کند. از طرف دیگر، ما در حال بررسی امکان ایجاد LLM مخصوص دامنه خود برای کشاورزی هستیم.

در محیط هایی که به سرعت در حال تغییر هستند، هم از نظر آب و هوا و هم از نظر بازار، مفهوم agri1.ai اهمیت فزاینده ای پیدا می کند. این امر به ویژه برای جوامع بزرگ کشاورزی محور و مناطقی مانند قاره آفریقا صادق است، جایی که کمبود دانش می تواند منجر به چالش های قابل توجهی در کشاورزی شود. یکی از مأموریت‌های agri1.ai رسیدگی به این مسائل، حمایت از کشاورزان خرده‌مالک در مبارزه با شرایط آب و هوایی سریع در حال تغییر و ارائه مشاوره بهتر برای فرهنگ‌های کشاورزی جدید بسته به شرایط آب و هوایی و خاک است. فقدان آموزش در نقاط خاصی از جهان نیز انگیزه ای برای ما برای حمایت از کشاورزان از طریق ابتکار عمل خود است.

وضعیت فعلی agri1.ai: پل زدن شکاف بین انسان ها و هوش مصنوعی

در قلب ابتکار ما، agri1.ai به عنوان یک پلتفرم پویا عمل می‌کند و شکاف بین انسان‌ها در کشاورزی و دنیای نرم‌افزار و الگوریتم‌های هوش مصنوعی را پر می‌کند. هدف اصلی ما تسهیل یک تعامل یکپارچه بین این دو نهاد است و یک رابطه همزیستی را تقویت می کند که کارایی و پایداری شیوه های کشاورزی را افزایش می دهد.

در حال حاضر، آgri1.ai بر اساس GPT OpenAI، یک مدل زبان بزرگ (LLM) کار می کند. ما تا حدی این مدل را برای درک بهتر و تولید متن کشاورزی محور تنظیم کرده‌ایم و ارتباط و کاربرد آن را برای کاربران خود افزایش می‌دهیم. علاوه بر این، ما تا حدی جاسازی‌های داده را با هم ترکیب کرده‌ایم که هم داده‌های عمومی و هم داده‌های داخلی را ادغام می‌کنند تا درک متنی مدل از حوزه کشاورزی را تقویت کنیم.

در حوزه هوش مصنوعی، سادگی اغلب کلید موفقیت است. ساختن و استقرار برنامه‌های هوش مصنوعی می‌تواند فرآیند پیچیده‌ای باشد و حفظ حس سادگی در عملیات ما به ما اجازه می‌دهد تا بر ارائه خدمات کاربرپسند و با کیفیت بالا تمرکز کنیم. با ایجاد یک LLM موجود و میزبانی شده، می‌توانیم از قدرت هوش مصنوعی پیشرفته و در عین حال حفظ یک سیستم کارآمد و کارآمد استفاده کنیم.

یکی از سنگ بنای عملیات ما حاکمیت داده است. ما اهمیت حیاتی مدیریت در دسترس بودن، قابلیت استفاده، یکپارچگی و امنیت داده های کاربران خود را درک می کنیم. این رویکرد جامع به حاکمیت داده‌ها نه تنها قابلیت اطمینان و سودمندی اطلاعات ارائه شده توسط agri1.ai را تضمین می‌کند، بلکه به نگرانی‌های کلیدی مانند رعایت مقررات، حریم خصوصی، کیفیت و امنیت نیز می‌پردازد. ما می دانیم که مشاغل کشاورزی نگرانی های معتبری در مورد نشت داده ها و پتانسیل آموزش LLM ها بر روی داده های داخلی دارند که حاکمیت داده ها را به خطر می اندازد. ما می‌خواهیم به کاربران خود اطمینان دهیم که این نگرانی‌ها را بسیار جدی می‌گیریم و فعالانه روی استراتژی‌هایی برای رسیدگی به این مسائل کار می‌کنیم.

همانطور که ما به پالایش و بهبود agri1.ai ادامه می دهیم، همچنین در حال بررسی امکان ایجاد یک LLM جدید با آموزش مجدد، یا تنظیم دقیق یک LLM موجود هستیم. این رویکرد به طور بالقوه می تواند به ما امکان ایجاد یک مدل تخصصی تر و موثرتر برای کشاورزی را بدهد.

آینده agri1.ai: مدل زبان بزرگ خاص دامنه برای کشاورزی

در حالی که ما به آنچه تاکنون با agri1.ai به دست آورده‌ایم افتخار می‌کنیم، اما در اینجا متوقف نمی‌شویم. ما همچنین در حال بررسی امکان ایجاد LLM مخصوص دامنه خود برای کشاورزی هستیم. این مدل، که ما آن را agriLLM (عنوان کاری) می‌نامیم، بر روی حجم زیادی از داده‌های متنی مرتبط با کشاورزی آموزش داده می‌شود و آن را به یک متخصص در زبان و تفاوت‌های ظریف صنعت کشاورزی تبدیل می‌کند.

ایجاد agriLLM یک فرآیند پیچیده خواهد بود که شامل جمع آوری داده ها، پاکسازی و پیش پردازش داده ها، انتخاب مدل، آموزش مدل، تنظیم دقیق، ارزیابی و آزمایش و استقرار است. ما همچنین در حال برنامه ریزی برای مشارکت دادن کارشناسان در زمینه های مختلف کشاورزی هستیم تا به ما در ساخت مجموعه داده های آموزشی دقیق و تنظیم دقیق مدل کمک کنند.

  1. جمع آوری داده ها: اولین گام در ایجاد یک دامنه خاص LLM برای کشاورزی شامل جمع آوری حجم وسیعی از داده های مربوط به این رشته است. این می تواند شامل مقالات علمی، مقالات تحقیقاتی، راهنمای کشاورزی، گزارش های آب و هوا، داده های عملکرد محصول و غیره باشد. داده‌ها باید طیف گسترده‌ای از موضوعات در کشاورزی را پوشش دهد تا اطمینان حاصل شود که مدل کاملاً جامع و آگاه در همه جنبه‌های این زمینه است. ابزارهایی مانند Web scraping را می توان برای خودکارسازی فرآیند جمع آوری داده ها از منابع مختلف آنلاین استفاده کرد.
  2. پیش پردازش داده ها: هنگامی که داده ها جمع آوری شد، باید از قبل پردازش شود تا برای آموزش LLM آماده شود. این شامل پاکسازی داده ها (حذف موارد تکراری، اصلاح مقادیر گم شده یا نادرست)، عادی سازی (تبدیل تمام متن به حروف کوچک، حذف علائم نقطه گذاری و توقف کلمات) و نشانه گذاری (تجزیه متن به کلمات یا عبارات جداگانه برای ایجاد واژگان برای مدل زبان).
  3. انتخاب مدل و پیکربندی: قدم بعدی انتخاب یک معماری مدل مناسب برای LLM است. مدل‌های مبتنی بر ترانسفورماتور مانند GPT-3 و BERT به دلیل توانایی آنها در مدیریت دنباله‌های طولانی متن و تولید خروجی‌های با کیفیت بالا، انتخاب‌های محبوبی هستند. پیکربندی مدل، شامل تعداد لایه‌ها، سرهای توجه، تابع از دست دادن و فراپارامترها باید در این مرحله مشخص شود.
  4. آموزش مدل: سپس مدل بر روی داده های از پیش پردازش شده آموزش داده می شود. این شامل ارائه مدل با توالی کلمات و آموزش آن برای پیش بینی کلمه بعدی در دنباله است. مدل وزن های خود را بر اساس تفاوت بین پیش بینی خود و کلمه بعدی واقعی تنظیم می کند. این فرآیند میلیون ها بار تکرار می شود تا زمانی که مدل به سطح عملکرد رضایت بخشی برسد.
  5. ارزیابی و تنظیم دقیق: پس از آموزش اولیه، مدل بر روی یک مجموعه داده آزمون جداگانه ارزیابی می شود. بر اساس نتایج ارزیابی، مدل ممکن است نیاز به تنظیم دقیق داشته باشد. این می تواند شامل تنظیم فراپارامترهای آن، تغییر معماری، یا آموزش داده های اضافی برای بهبود عملکرد آن باشد.
  6. تنظیم دقیق دامنه خاص: برای اینکه LLM مختص کشاورزی باشد، روی داده های خاص دامنه جمع آوری شده در مرحله اول به خوبی تنظیم می شود. این به مدل کمک می کند تا اصطلاحات منحصر به فرد، زمینه و تفاوت های ظریف حوزه کشاورزی را درک کند.
  7. ادغام با agri1.ai: هنگامی که LLM مخصوص دامنه آماده شد، با سیستم agri1.ai یکپارچه می شود. این شامل راه‌اندازی APIها و رابط‌های لازم است تا به agri1.ai اجازه دهد تا از قابلیت‌های LLM جدید استفاده کند.
  8. تست و بازخورد کاربر: سیستم به روز شده agri1.ai سپس توسط کاربران نهایی آزمایش می شود. بازخورد آنها جمع‌آوری می‌شود و برای شناسایی هر موضوع یا زمینه‌ای برای بهبود استفاده می‌شود.
  9. پیشرفت مداوم: بر اساس بازخورد کاربران، LLM به طور مداوم به روز و بهبود می یابد. این می‌تواند شامل تنظیم دقیق‌تر، افزودن داده‌های بیشتر به مجموعه آموزشی، یا بهینه‌سازی معماری مدل باشد.
  10. نظارت و نگهداری: در نهایت، عملکرد LLM به طور مداوم نظارت می شود تا از ارائه خروجی دقیق و مفید اطمینان حاصل شود. تعمیر و نگهداری منظم نیز برای حفظ عملکرد روان سیستم انجام می شود.

ایجاد یک دامنه خاص LLM برای کشاورزی یک کار پیچیده اما قابل دستیابی است. این شامل یک سری مراحل از جمع آوری داده ها تا بهبود مستمر است. با دنبال کردن این فرآیند، هدف ما توسعه یک LLM است که می‌تواند اطلاعات دقیق، مرتبط و مفیدی را در اختیار کاربران صنعت کشاورزی قرار دهد.

رویکردها و مدل های منبع باز

ما تحولات در جامعه گسترده تر هوش مصنوعی را زیر نظر داریم. یکی از منابعی که ما به ویژه مفید یافتیم منبع است جدول امتیازات LMSYS، که LLM های مختلف را بر اساس عملکرد آنها رتبه بندی می کند. برخی از مدل‌های این تابلوی امتیازات، مانند GPT-4 OpenAI و Claude-v1 Anthropic، می‌توانند به طور بالقوه به عنوان پایه‌ای برای agriLLM استفاده شوند.

با این حال، ما همچنین از شکاف بین مدل های اختصاصی و منبع باز آگاه هستیم. در حالی که مدل‌های اختصاصی مانند GPT-4 در حال حاضر پیشرو هستند، ما نسبت به پتانسیل مدل‌های منبع باز برای رسیدن به عقب خوش‌بین هستیم. یکی از این مدل‌های منبع باز MosaicML است که یک پلتفرم انعطاف‌پذیر و ماژولار برای مدل‌های یادگیری ماشین فراهم می‌کند و می‌تواند به طور بالقوه برای آموزش LLM خودمان مورد استفاده قرار گیرد.

MosaicML طیف وسیعی از ویژگی ها را ارائه می دهد که می تواند برای توسعه agriLLM مفید باشد. این امکان آموزش مدل های چند میلیارد پارامتری را در ساعت ها و نه روزها فراهم می کند و مقیاس بندی کارآمد را در مقیاس های بزرگ ارائه می دهد. همچنین بهبود عملکرد خودکار را ارائه می دهد و به کاربران اجازه می دهد تا در لبه پر بازدهی باقی بمانند. پلتفرم MosaicML از آموزش مدل‌های زبان بزرگ در مقیاس با یک فرمان پشتیبانی می‌کند، و از سرگیری خودکار از خرابی گره‌ها و نوک تلفات پشتیبانی می‌کند، که می‌تواند به ویژه برای زمان‌های طولانی آموزش مرتبط با مدل‌های بزرگ مانند agriLLM مفید باشد.

LLM های موجود در کشاورزی

در تحقیقات خود، ما با یک مدل خاص برای کشاورزی مواجه شدیم، به نام AgricultureBERT، یک مدل زبان مبتنی بر BERT که بیشتر از قبل از ایستگاه بازرسی SciBERT آموزش دیده است. این مدل بر روی مجموعه داده های متوازن از کارهای علمی و عمومی در حوزه کشاورزی آموزش داده شده است که دانش حوزه های مختلف تحقیقات کشاورزی و دانش عملی را در بر می گیرد.

مجموعه مورد استفاده برای آموزش AgricultureBERT شامل 1.2 میلیون پاراگراف از کتابخانه ملی کشاورزی (NAL) از دولت ایالات متحده و 5.3 میلیون پاراگراف از کتاب ها و ادبیات رایج از حوزه کشاورزی است. این مدل با استفاده از رویکرد یادگیری خود نظارتی مدل‌سازی زبان نقاب‌دار (MLM) آموزش داده شد که شامل پوشاندن 15% از کلمات در جمله ورودی و سپس پیش‌بینی مدل کلمات پوشانده شده است. این رویکرد به مدل اجازه می‌دهد تا یک نمایش دوطرفه جمله را بیاموزد، که با شبکه‌های عصبی بازگشتی سنتی (RNN) که معمولاً کلمات را یکی پس از دیگری می‌بینند، یا از مدل‌های اتورگرسیو مانند GPT که به صورت داخلی نشانه‌های آینده را پنهان می‌کند، متفاوت است.

این مدل موجود می تواند بینش های ارزشمندی را ارائه دهد و به عنوان یک نقطه شروع مفید عمل کند، هدف نهایی ما در agri1.ai توسعه LLM مختص دامنه خودمان برای کشاورزی است. ما معتقدیم که با انجام این کار، می توانیم مدلی ایجاد کنیم که حتی بیشتر با نیازهای صنعت کشاورزی مطابقت داشته باشد و اطلاعات دقیق و مرتبط تری را در اختیار کاربران خود قرار دهد.

Keep It Agile: The Journey Continues

در زمینه به سرعت در حال تکامل هوش مصنوعی، یادگیری مداوم و سازگاری کلیدی است. این سفر یک تجربه یادگیری عمیق بوده است، به خصوص برای من، مکس.

درک روش‌های منحصربه‌فرد تعامل کاربران با هوش مصنوعی در زمینه کشاورزی هم روشنگر و هم آموزنده بوده است. هر درخواستی که از کشاورزان در سراسر جهان دریافت می کنیم، بینش ارزشمندی را در مورد چالش های دنیای واقعی ارائه می دهد که agri1.ai می تواند به آنها رسیدگی کند. رویکرد ما تکراری است - ما تعاملات کاربر را مشاهده می‌کنیم، با کاربران گفتگو می‌کنیم، راه‌حل‌ها را توسعه می‌دهیم، آنها را ارسال می‌کنیم و سپس دوباره ارزیابی می‌کنیم.

این چرخه به ما این امکان را می دهد که دائماً محصول خود را اصلاح و بهبود دهیم و اطمینان حاصل کنیم که برای کاربرانمان مرتبط و مفید است. ما از پتانسیل بهبود رابط کاربری (UI) و تجربه کاربر (UX) برای بهبود بیشتر قابلیت استفاده agri1.ai هیجان زده هستیم. سرعت توسعه در صحنه هوش مصنوعی نفس گیر است و مدل ها و فناوری های جدید به طور مرتب در حال ظهور هستند. ما متعهد هستیم که در جریان این پیشرفت‌ها قرار بگیریم و بررسی کنیم که چگونه می‌توانیم از آنها برای تقویت agri1.ai و خدمات بهتر به کشاورزان و مشاغل کشاورزی در سراسر جهان استفاده کنیم.

من می دانم که این تازه آغاز راه است. سفر agri1.ai یک فرآیند مداوم است و من متعهد به ادامه یادگیری، سازگاری و بهبود هستم. من در مورد پتانسیل هوش مصنوعی برای متحول کردن کشاورزی هیجان زده هستم و از فرصتی که برای حضور در این سفر داشتم سپاسگزارم. از اینکه در این ماجراجویی با ما همراه بودید سپاسگزاریم.

fa_IRPersian