Pesquisadores desenvolvem sistema mecanizado que facilita produção de gliricídia
Espécie arbórea é capaz de gerar, anualmente, até 900 quilos de nitrogênio por hectare, reduzindo custos e impactos da aplicação do nutriente
A Syngenta Seeds anunciou negócio com a empresa de inteligência artificial InstaDeep para unir as capacidades de pesquisa e desenvolvimento de características (“traits”) da Syngenta com a plataforma de Modelo de Linguagem Grande (LLM) da InstaDeep.
O objetivo dessa parceria é acelerar o desenvolvimento de traços de culturas. Conforme as empresas, a fase inicial concentrar-se-á em milho e soja.
A InstaDeep desenvolveu um modelo de linguagem chamado AgroNT. Ele foi treinado em trilhões de nucleotídeos de espécies de culturas relevantes para a agricultura. Essa tecnologia "aprende" com a natureza e foi projetada para prever com precisão como os genes são regulados, potencialmente permitindo um novo nível de controle de características (“traits”) e desempenho das culturas.
"Estamos entusiasmados em colaborar com a InstaDeep e trazer insights da IA avançada para acelerar o avanço do nosso pipeline de traços proprietários, permitindo-nos oferecer soluções inovadoras e eficazes para os desafios enfrentados pela agricultura", disse Gusui Wu, Chefe Global de Pesquisa da Syngenta Seeds.
"O potencial dos LLMs para entender a linguagem do DNA abre novas oportunidades para obter insights e entregar mais rapidamente as características que os agricultores precisam para melhorar e proteger os rendimentos”, acrescentou.
Por sua vez, Karim Beguir, CEO e Co-Fundador da InstaDeep, pontuou que "nossa colaboração com a Syngenta Seeds é um marco importante para a InstaDeep e para a ciência agrícola. Estamos empolgados com o potencial da IA para descobrir e entregar novas características críticas para avançar em um sistema alimentar mais sustentável, resiliente e produtivo”.
Um Modelo de Linguagem Grande (LLM), também conhecido como Modelo de Linguagem de Grande Escala (MLGE), é um tipo de inteligência artificial (IA) que se destaca na compreensão e utilização da linguagem humana.
A chave dos LLMs reside em seu treinamento em conjuntos de dados massivos de texto e código. Essa quantidade colossal de informação, proveniente de livros, artigos, websites, repositórios de código e outras fontes, permite que os modelos identifiquem padrões complexos na linguagem humana. Quanto mais dados, melhor se torna a compreensão e geração de linguagem natural.
Artigo descrevendo o LLM da InstaDeep recebeu o seguinte resumo:
"Progressos significativos foram feitos no campo da genômica vegetal, conforme demonstrado pelo aumento do uso de metodologias de alto rendimento que permitem a caracterização de múltiplos fenótipos moleculares em todo o genoma. Estas descobertas forneceram informações valiosas sobre as características das plantas e seus mecanismos genéticos subjacentes, particularmente em espécies de plantas modelo. No entanto, aproveitá-los eficazmente para fazer previsões precisas representa um passo crítico na melhoria genômica das culturas. Apresentamos o AgroNT, um modelo fundamental de linguagem grande treinado em genomas de 48 espécies de plantas com foco predominante em espécies agrícolas. Mostramos que o AgroNT pode obter previsões de última geração para anotações regulatórias, força do promotor/terminador, expressão gênica específica de tecido e priorizar variantes funcionais. Realizamos uma análise de mutagênese de saturação 'in silico' em larga escala na mandioca para avaliar o impacto regulatório de mais de 10 milhões de mutações e fornecer seus efeitos previstos como um recurso para a caracterização de variantes. Finalmente, propomos o uso dos diversos conjuntos de dados compilados aqui como o Plants Genomic Benchmark (PGB), fornecendo uma referência abrangente para métodos baseados em aprendizagem profunda na pesquisa genômica de plantas.”
Receba por e-mail as últimas notícias sobre agricultura
Receba por e-mail as últimas notícias sobre agricultura