印度AI聚焦小型模型,助力小农农业变革
到2026年,全球人工智能格局将出现新的“三巨头”,在斯坦福大学最新发布的全球人工智能活力指数中,印度仅次于美国和中国,超越了英国和韩国等国家。印度人工智能正全力推进,2026年已宣布一系列计划,显然旨在巩固其市场地位。 最新进展是在本月初,财政部长尼尔马拉·西塔拉曼公布了一项具有里程碑意义的政策:对全球人工智能工作负载实行 20 年的免税期,到 2047 年期间免征所有税款。 此举旨在将印度打造成为全球“人工智能后台”,而科技巨头们已经纷纷入驻。亚马逊已承诺投资350亿美元用于其在印度的云业务,微软也承诺投资175亿美元,在海得拉巴建设其在亚洲最大的超大规模数据中心。与此同时,谷歌也斥资150亿美元在维沙卡帕特南建立了一个人工智能中心,巩固了其在印度的地位。 虽然硅谷引领着这场基础设施建设浪潮,但应用程序却越来越多地由本土开发。 在农业领域,这一点尤为重要,政府最近也采取了重大举措来弥合人工智能与农业之间的差距。 1月下旬,该公司宣布推出Bharat-VISTAAR,这是一款多语言人工智能工具,旨在为农民提供咨询支持。该工具整合了政府农业数字化项目AgriStack的数据,以及印度农业研究理事会(ICAR)的验证实践经验。其目标是提高农业生产力,辅助农民进行决策,并降低整体风险。 这只是印度为克服人工智能在农业领域更广泛应用所面临的障碍而采取的众多措施中的一个例子。 人工智能普及面临“诸多障碍”。 在一个拥有近 15 亿人口的国家,提高农业生产力和改善民生绝非易事。该国 86% 的农业用地面积在 2 公顷或以下,农民年收入平均约为 1500 美元。 尽管科技行业“充满活力”,但世界经济论坛 (WEF) 2025 年关于人工智能在印度农业中应用的报告强调了“诸多障碍,包括基础设施分散、高质量数据获取有限以及小农户的负担能力问题”。 世界经济论坛的研究结果表明,小规模土地所有权固有的局限性制约了生产规模化、机械化和技术应用。“因此,边缘农民往往仍然局限于以自给自足为导向的生产系统,其特点是生产力低下、剩余产品少、盈利能力有限,”报告指出。 机构信贷、优质投入品、充足的收获后储存设施和市场信息的匮乏,加剧了这一问题。 但研究人员所说的“不稳定的基础设施”也阻碍了这一进程:印度政府大力推广的人工智能工作负载所需的电力是传统数据中心的五倍,用水量是传统数据中心的十倍。而这些资源在印度农村地区本就捉襟见肘。 这些限制使得直接向小农户销售数字农业服务(人工智能或其他)成为一项艰巨的任务。 正如人工智能初创公司 Myca 的联合创始人兼首席营收官 Seamus Tardif 所说,“让全球南方的农民实现经济变现几乎是不可能的。” 无需增加员工人数即可扩大农业企业规模 这就是为什么一些初创公司停止直接向农民销售产品的原因。塔迪夫认为,接触小农户最有效的方式是通过那些已经向他们供货的农业企业。 这些公司管理的现场工作人员目前人手不足,通常每 1000 名农民才配备一名顾问。 Myca 的系统利用人工智能推理能力来优化这些田间团队,根据历史销售数据、作物种植日历、当地气候变量和公司整体目标来分配人力。这意味着田间团队的活动将更加有计划性,而非像目前这样随意,其目标是帮助这些公司在不线性增加员工人数的情况下扩大影响力。通过转向“智能体大规划”,Tardif 和他的团队已经证明,他们可以将顾问与农民的比例从 1:10 提高到 1:60,从而使田间团队的活动更加有计划性而非随意性。 与此同时,Myca 的信贷产品 Watchman 利用机器学习技术,对信贷分配和管理进行更严格的控制,不再采用典型的季节性或年度信用评分,而是采用基于每笔交易的评分系统。 他补充说,实地情况(即从实地和实地代理人收集的数据)在确定信用度方面起着至关重要的作用。 “如果没有这些实地洞察,你就只构建了信用故事的一半,这仍然会让你面临很大的风险。” 弥合农民的知识差距 Pratik Desai 博士多年来一直专注于用户界面研究。早在 ChatGPT 被大众所熟知之前,Desai 就意识到最大的障碍是“语言鸿沟”。即使人工智能再出色,如果它不能理解农民的语言——无论是字面意义还是语境意义——那也毫无用处。 2023年初,他的团队推出了KissanAI,这是一款基于语音的助手,它允许农民用母语与应用程序交流,从而克服了识字障碍。这个简单界面的效果立竿见影:“突然之间,农民们就自发地来找我们了,”他说。“短短几个月内,我们就有了10万名农民使用这款应用程序,这在以前是无法想象的。界面非常简单。点击一个按钮,用你的语言说话,它就会回复你,”德赛说道。 该系统也基于区域细微差别:例如,它知道北方邦的“比加”土地接近半英亩,而阿萨姆邦的“比加”土地只有 0.33 英亩。 通过捕捉这些区域工作流程,KissanAI 也成为了拜耳等巨头的垂直解决方案提供商,帮助拜耳扩展农艺师服务,直接向种植户提供具体的产品推荐和用量建议。拜耳人工智能咨询应用 ELY 中的深度研究模型使农艺师能够深入挖掘详细的合规性、经济和销售数据,从而为种植户提供更全面、更专业的解答。 “当收到查询时,模型不仅会将其转换成合适的语言,还会识别出(农民)在说什么,”德赛说道。“如果你的知识库是基于农业、乳制品或类似行业的,(系统)就能理解这些行业的运作方式以及他们如何与农民打交道。所有这些工作流程都很重要,因为通用型公司可能根本无法理解他们想要做什么。” 据 Metal Dog Labs 的管理合伙人 Rhishi Pethe 称,寻找、组织和构建与语言、测量、气候等方面的明显区域差异相关的分散且通常不是数字的数据集绝非易事。 事实上,数据是制约印度人工智能能力发展(尤其是在农业领域)的主要瓶颈,因此像KissanAI和DigitalGreen这样的工作组尤其令人印象深刻,他补充道。 “在印度,获取用于训练任何人工智能或世代人工智能模型的数据始终是一个挑战。数据分散在各处,很多数据没有得到很好的记录,或者只是以PDF等形式存在,”他告诉AgFunderNews。 “如果你想从中获得价值,就必须付出努力。例如,Digital Green 或 Kisan 等公司实际上花了几年时间在互联网上搜寻所有这些数据,这些数据格式各异,而且很多数据甚至没有数字化版本,所以他们必须做大量的工作。” 通过小语种模式惠及更多农民 与此同时,对效率的追求也导致了人们逐渐摒弃体积庞大、价格昂贵的车型。 Digital Green 的 FarmerChat 应用采用了 Gemma 和 GPT-4o mini 等小型语言模型 (SLM)。创始人 Rikin Gandhi 解释说,小农户往往会问一些季节性的、有限的问题,例如“我的叶子为什么会变黄?”或“哪里能买到最近的优质种子?”,这使得规模更小、经过精细调整的模型更容易处理这些问题。 与通用模型相比,这种模块化人工智能架构的成本降低了 8 倍,延迟也更低。而且,由于 Digital Green 是一家非营利组织,它可以投资于更长远的研发项目,例如多模态图像理解,并在 Hugging Face 等平台上公开共享其数据集。这减少了整个生态系统中的重复工作,创建了一种“公共产品”模式,Gandhi 认为这对于技术的持续应用至关重要。 工程技术水平和人才 宏观数据描绘出一幅印度人工智能超级大国蓬勃发展的景象,但那些关注实地生态系统的人士看到的却是更为复杂的现实。佩特指出,印度人工智能的成熟度高度集中。他以KissanAI为例,该公司利用合成数据——生成人工数据集来训练模型,以弥补现实世界农业数据的匮乏——展现了其高端能力。 “这种水平的工作相当复杂,非常适合像印度这样数据匮乏的环境,”佩特说,但他同时警告说,“这种复杂程度尚未普及。” 佩特认为,印度人工智能工程师最显著的特点是对实用性而非理论的极致追求。与旧金山的前沿研究不同,印度开发者不太执着于模型的“实现方式”,而更关注模型的“功能”。 “我接触过的印度工程师都很务实,注重应用:他们不太热衷于构建基础模型,而是更关注‘如何让它为我的应用服务?’”佩特观察到。 他认为,虽然尖端的生成式人工智能研究仍然向硅谷倾斜,但印度在尝试“聊天机器人和基于 WhatsApp 的咨询服务等应用案例”方面处于领先地位,这些案例可以解决眼前的实际问题。 当然,人们越来越关注构建本土基础模型(通常被称为“BharatGPT”),以确保印度不会完全依赖外国技术。然而,训练这些模型的高昂成本仍然是一大障碍。 “构建基础模型是一项耗资巨大的工程,”佩特指出。“大多数人选择在现有的全球模型(例如 ChatGPT 或 Llama)的基础上进行构建,而不是创建专门针对印度农业的基础模型。” “现在还为时尚早。” 尽管投入了数十亿美元,全球排名也节节攀升,但印度农业的数字化普及率仍然低得惊人,估计仅为20%。正如Omnivore公司的马克·卡恩所指出的,人工智能的应用目前呈现“波动”趋势,一些农业企业正在构建复杂的内部解决方案,而另一些企业才刚刚开始尝试。 “现在还处于非常早期的阶段,”卡恩说。“人工智能的普及程度并不均衡。一些农业企业正在尝试开发自己的解决方案,另一些则在与全球最大的企业合作。还有一些企业则试图与规模较小的企业合作。” 最终,印度的AI故事正从实验室走向实际应用。在一个数据常常被困于纸质记录和地方方言的国家,真正的胜利不在于模型的规模,而在于最终能否让模型真正为一线人员所用。 这种复杂性在2021年麻省理工学院牵头的一项研究中得到了印证。该研究指出了18个阻碍人工智能普及的明确障碍,并揭示了一个“信任悖论”:农村社区往往对技术抱有怀疑态度。研究表明,只有当人工智能被视为一种本土化的、切实可行的工具,而非一个陌生的“黑匣子”时,大规模普及仍将难以实现。