随着互联网的普及,农业知识和信息的获取变得更加便捷,但信息大多固定且通用,无法针对具体情况提供定制化的解决方案。在此背景下,大语言模型(Large Language Models,LLMs)作为一种高效的人工智能工具,逐渐在农业领域中获得关注和应用。目前,LLMs技术在农业领域大模型的相关综述中只是简单描述,并没有系统地介绍LLMs构建流程。本文重点介绍了农业垂直领域大语言模型构建流程,包括数据采集和预处理、选择适当的LLMs基模型、微调训练、检索增强生成 (Retrieval Augmented Generation,RAG)技术、评估过程。以及介绍了LangChain框架在农业问答系统中的构建。最后,总结出当前构建农业垂直领域大语言模型的一些挑战,包括数据安全挑战、模型遗忘挑战和模型幻觉挑战,以及提出了未来农业垂直领域大语言的发展方向,包括多模态数据融合、强时效数据更新、多语言知识表达和微调成本优化,以进一步提高农业生产的智能化和现代化水平。
水稻是我国三大粮食作物之一,准确、高效、及时地预测水稻产量对品种选育和优化田间管理至关重要。无人机遥感系统凭借其快速、无损、成本低、通量高等优势,被广泛应用在作物病虫害识别、作物生长监测和作物表型分析等领域。为探究光谱数据在水稻产量估测方面发挥的作用,本数据集利用无人机遥感采集了水稻生长过程中的多光谱图像。选取106个1 m×1 m的样本点人工采样测产,同时在采样后采集了可见光图像,实现光谱图像和产量数据间的关联。经过人工检查和整理构建了本数据集。数据采集地点为黑龙江省,无人机在无云、光照充足的条件下进行数据采集,采集时间为2023年7月至2023年8月,共采集试验田内不同品种3天的多光谱数据和1天的可见光数据。本数据集各项数据完整,可为产量估测研究提供数据支撑。
数据摘要:
随着大数据和机器学习技术的进一步发展,处理具有几十上百维特征的复杂结构和关系且蕴含丰富语义信息的高维数据成为一项挑战。在保障个人隐私不被泄露的前提下,如何安全地使用这些高维数据,成为当前的一个重要话题。我们查阅资料发现:关于差分隐私技术本身的综述很多,但是面向高维数据发布的差分隐私算法及应用的综述却很少。基于此,本文通过对差分隐私在高维数据领域的应用进行综述,深入了解不同方法在保护高维数据隐私方面的优劣,并指导面向高维数据发布的差分隐私算法未来研究的方向,从而更好地应对隐私保护和数据分析的挑战。本文首先介绍了差分隐私的原理和特性,总结了当前差分隐私技术本身的研究工作。然后从数据降维和数据合成两个角度分析了差分隐私在高维数据环境中的应用,探讨了差分隐私面临的问题和挑战,并提出了初步的解决方法,旨在更好地解决当前高维数据保护和使用的问题。最后,本文提出了未来可能的研究方向以促进技术交流,推动差分隐私在高维数据应用中的进一步突破。
在现代信息社会,数据隐私保护成为公众关注的焦点。随着互联网用户对个人信息安全的日益重视,信息检索领域的隐私保护研究变得至关重要。隐私保护关键词检索技术旨在在不泄露用户查询意图的情况下,提供安全、保护隐私的检索服务。尽管现有技术在满足基本需求方面取得了进展,但如何在保持效率的同时减少隐私泄露风险,仍是一个挑战。为此,本文对隐私保护关键词检索技术进行了详细回顾,系统地分析了当前主流技术的原理、优势与不足。研究发现,尽管已有技术能够对用户查询进行加密处理,防止敏感信息直接泄露,但在查询模式、访问模式与返回结果之间,仍存在着潜在的隐私泄露风险。针对这一问题,本文提出了一系列改进方向,以增强隐私保护的效果。此外,当前的隐私保护技术在实际应用中面临诸多挑战,这些挑战涉及技术增强、隐私合规等多个方面。通过对隐私保护关键词检索相关前沿技术的融合与创新,有望为解决这些技术问题提供新的思路和方案,推动隐私保护技术向更高水平发展。本文最后对隐私保护关键词检索技术的未来发展方向和创新应用模式进行了展望。
大田作物大多采取露地种植方式。东北地区全年温度较低,在作物苗期如果出现日照和降雨量大范围的波动,则十分容易导致农作物出现苗弱苗小、根系长势弱以及发育不全和生长缓慢等现象。若能对农作物苗期实时监测和管理,及时掌握其生长状态及其环境情况,便可及早做出决策。本研究于2022年5月9日—2022年6月16日期间,对试验田内11个气象站的小麦、玉米和水稻、小麦苗期图像进行采集,通过整理和筛查后形成的数据量约为2.59 GB,其中可见光RGB 1.48 GB,近红外光谱 1.11 GB。本数据集可以通过RGB可见光数据和近红外光谱数据完成对作物的叶龄识别,将提取出的特征(颜色特征、图像特征、纹理特征、植被指数)带入机器学习回归模型中进行分析预测,同时本数据集还适用于构建作物识别或幼苗识别的卷积神经网络模型,以进一步精准实现作物检测及插秧后漏苗、补苗等研究。
在当前信息化高速发展的背景下,智慧农业作为农业发展的必然趋势,其中农业大数据是实现智慧农业的重要支撑。尽管农业大数据带来了巨大的产业动能,但也伴随诸多的数据安全问题,有效处理农业大数据技术与数据安全的关系显得至关重要。首先综合分析当前各种观点重新定义了农业大数据,然后通过案例详述了其在农业供应链各环节中的促进作用,接着深入剖析了农业大数据的泛在性、社会性、交叉性等专有特征。最后,基于安全三项基本要素(机密性、完整性和可用性)以及农业大数据的专有特征,从数据采集、数据传输、数据存储等大数据生命周期的七个阶段出发,构建了智慧农业场景下的大数据安全风险框架。从大数据存在的共性问题引出农业领域下基于专有特征的特性问题,并结合实际智慧农业场景,提出了有针对性的安全解决策略。本文将对未来研究智慧农业领域中数据安全问题的解决方案提供新思路,旨在促进智慧农业更快更安全发展。
当前我国农业生产模式从传统向智慧农业转型,针对各农业组织自身数据规模不断扩大,数据共享出现“数据孤岛”难以大规模汇聚农业数据指导精准农事决策等问题,本研究基于云链融合和分布式农业场景下数据安全治理相关技术解决所述问题,并探索其实际应用效果。在分布式农业场景下,以IPFS、区块链和云计算为基础,设计可部署在智能合约的农业大数据治理算法,构建多方农业数据汇聚模型以及完整、安全、可追溯的数据保护模型和典型场景应用模型。以新疆昌吉华兴农场及其附属农业组织农业生产为例,进一步构建云链融合农业大数据平台。对比本文所设计的基于云链融合的农业大数据治理模型和两种传统模型的性能,实验表明,本模型综合性能相比于传统模型更优。
在数据安全和隐私保护日益重要的背景下,零知识证明(Zero-Knowledge Proofs, ZKPs)为保护隐私提供了强有力的工具,成为最具应用潜力的核心技术之一。本文综合探讨了零知识证明技术及其在区块链中的应用。首先,详细介绍了零知识证明的相关概念以及三种典型的技术,对ZK-Snarks进行了深入探讨,并讨论了ZK-Stark和Bulletproofs等其他证明机制,深入对比分析了各自的设计、技术特点、性能和应用场景的差异。在此基础上,重点介绍了ZKPs在区块链环境下的应用,并分析整理了编写零知识证明的相关工具,这些工具在提升具体应用的性能方面尤为重要。最后,指出了一些潜在的问题和未来的研究方向。
科学数据是战略性、基础性科技资源,深刻影响着各国的国家安全、经济发展和科技进步综合竞争力。在开放科学背景下,科学数据作为数据密集型科学研究范式的成果及重要支撑的同时,也面临着安全合规、可信可靠共享方面严峻的安全挑战。笔者从我国科学数据共享面临的安全挑战出发,以促进科学数据开放共享为目标,以构建动态、细粒度、领域适用的数据分类分级制度为核心,从政策、管理、技术、评估和监管等方面,提出科学数据安全战略,促进科学数据安全开发利用,实现科技强国的目标。
随着人工智能和材料科学数据驱动的材料设计热潮的兴起,材料科学数据成为生产要素、国家战略资源和国际竞争的焦点。然而,随着材料数据共享的增加,数据安全问题变得不可忽视。数据泄露、滥用、篡改等问题威胁着企业竞争力。本文综述了目前主流的数据安全保护技术,包括访问控制、加密技术,构成了传统的数据安全防护模型,实现数据传输、存储时的安全。区块链技术可以实现数据传输、存储时的机密性、完整性、可用性,但是这些机制仍无法解决数据使用时的隐私问题,无法保护使用中的数据机密性、完整性等问题。利用机密计算技术的优势,在硬件可信执行环境中执行计算,最小化计算环境的可信基,提供全方位的数据保护,践行“数据可用不可见”理念,实现对使用中的数据保护,进而构建端到端的全生命周期数据安全。本文结合区块链和机密计算技术的优势,提出基于区块链和机密计算的材料数据可信基础设施方案,以实现数据的全生命周期安全,为材料数据的安全应用提供有力支持。
农业是最基础、最有代表性的传统产业,加快建设农业强国,亟需培育和发展农业新质生产力。数字技术是新一轮科技革命和产业变革的先导力量,全面推动数农融合的智慧农业将成为加快形成农业新质生产力的重要着力点。该文从马克思主义生产力理论出发,对新质生产力的科学内涵、农业新质生产力的基本特征及智慧农业建设的现实需求、发展趋势、重点方向等进行研究,将国内外文献、统计数据、调研结果相结合,提出强力推进智慧农业建设、加快形成农业新质生产力良好生态的路径措施。我国智慧农业建设正从“盆景”转变为“风景”,已进入大数据、物联网、区块链、人工智能、卫星遥感、北斗等多种现代信息技术协同高效、系统集成的新阶段,需从重点行业着手,加快形成智慧农业建设发展的大气候。要把智慧农业作为推进农业强国建设的重要抓手,解决好数据这个最大的制约因素,推动现代信息技术与农业产业深度融合,打造高素质创新型劳动者队伍,充分发挥企业的创新主体作用,加强关键核心技术攻关,顺应数字化、绿色化两大转型的发展大势,加快培育和发展农业新质生产力。
冬小麦和夏玉米是黄淮平原农田生态系统中的主粮作物,为保障国家粮食安全作出了突出贡献。准确掌握主粮作物关键物候期对估算作物产量、改进农业生产管理水平、预防农业气象灾害具有重要意义。本数据集整合了黄河故道冲积平原区近15年(2008—2022年)一年两熟冬小麦-夏玉米连作制度下作物不同物候期的生态观测数据,主要包含观测样地信息、冬小麦物候期数据、夏玉米物候期数据。本数据集将为区域农业定量遥感研究、作物生长模型模拟研究、农业气候变化研究及农业生产和管理决策提供科学依据和数据支撑。
信息化时代,科技创新越来越依赖于科学数据。随着国际竞争形势愈发严峻,科学数据安全与出境管理问题日益凸显。当前,我国科学数据出境管理存在政策法规不完善、技术能力不够、国际合作机制不完备等问题,亟须完善相关管理制度,建立协调统一的科学数据出境管理体系;加强数据安全监测与监管技术研发,推动科学数据关键技术创新升级;积极探索双边多边国际科学数据合作,引领国际科学数据规则框架制定。与其他国家一起共同应对科学数据出境中的风险挑战,推动全球科学数据安全、有序流通,加速科技创新发展。
随着全球数据安全法律法规愈发关注隐私保护,以及数据主权、科技竞争和地缘政治等新型治理因素的影响,科学数据的“保护”要求不断提高。这种趋势在一定程度上抑制了数据采集、处理、传输和分析等“利用”功能,并对既有科学数据的“保护-利用”平衡产生了负面影响。目前,这种失衡趋势表现为法律合规负担过重以及公共科学数据可用性逐渐减弱等治理挑战,现有研究和实践缺乏必要的分析工具来全面、系统地理解并应对这些挑战。为填补这一空白,论文提出了一个基于规则的科学数据安全治理框架,旨在从法律法规、伦理规范和机构政策等安全治理规则的角度系统分析“保护-利用”失衡及相关挑战。该框架整合了主要的科学数据安全治理规则类型,并结合“岛桥模型”、“法律-伦理”均衡和“适度落实”原则等三项分析工具,构建了治理规则与“保护-利用”平衡之间的传导路径。通过这一框架,论文解释并初步验证了其在理解科学数据合规责任过重和公共科学数据可用性弱化两大挑战中的应用价值。在全球科学数据安全法规日趋严苛的背景下,本文提出的基于规则的分析视角及相关工具,丰富了科学数据安全治理的理论基础,并为学术界、数据管理者和政策制定者提供了应对当前挑战的有效工具和政策沟通的理论支撑。这一框架为未来在数据安全治理中的应用和扩展提供了重要参考,也为保障科学数据的可持续利用提供了关键指导。