. Petras-v, . Ferro-n, M. Gäde, . Isaac-a, M. Kleineberg et al., Cultural heritage in clef (chic) overview, 2012.

. E. Robertson-s, . Walker-s, . Jones-s, . M. Hancock-beaulieu-m, and M. Gatford, Okapi at trec-3, Nist Special Publication Sp, vol.109, issue.2, 1995.

G. Zuccon, B. Koopman, and . Bruza-p.-&-azzopardi-l, Integrating and evaluating neural word embeddings in information retrieval, Proceedings of the 20th Australasian Document Computing Symposium, ADCS '15, vol.12, p.9, 2015.

, Références la statistique agricole annuelle présentation générale

J. Lacasta, F. Falquet-g.,, J. Zarazaga-soria, and . Nogueras-iso-j, An automatic method for reporting the quality of thesauri, Data & Knowledge Engineering, vol.104, pp.1-14, 2016.

,

C. Mader, B. Haslhofer, and . Isaac-a, Finding quality issues in SKOS vocabularies, Theory and Practice of Digital Libraries, pp.222-233, 2002.

M. A. Bechhofer-s, SKOS simple knowledge organization system reference. Portail: Agriculture et agronomie. Disponible à l'url, 2009.

. Suominen-o and . Hyvönen-e, Improving the quality of SKOS vocabularies with Skosify, International Conference on Knowledge Engineering and Knowledge Management, pp.383-397, 2012.

, Classement_en_France_des_cultures_par_groupes _d'usage Annotation sémantique des BSV FIGURE 2 -Schéma d'annotation des BSV, 2015.

P. De, Il existe, néanmoins des ontologies et schémas de données qui peuvent être réutilisées. Nous nous appuyons également sur le thésaurus qui a été construit manuellement à partir du Larousse Agricole pour référencer les types de culture. Nous avons effectué une recherche sur le Web de données liées ainsi que sur des plates-formes dédiées telle AgroPortal 5 . Nous présentons dans ce qui suit l'ensemble des ressources que nous exploitons pour définir le schéma d'annotation sur les observations

, Les classes d'usage de la production agricole sont destinées, à l'alimentation humaine, ou à l'alimentation animale ou à l'industrie. Les besoins de l'industrie sont la conception de textile (lin, chanvre) ou d'autres utilisations industrielles (huiles à usage particulier, biocarburants). Dans ce thésaurus, les liens hiérarchiques représentent des relations de généralisation/spécialisation entre cultures (céréale/blé). Ce vocabulaire de type de culture est disponible sur le Web de données liées sous format SKOS 6, Thésaurus FrenchCropUsage est un thésaurus construit à l'Irstea. il référence les types de cultures organisés en fonction de leurs usages, intitulé FrenchCropUsage

. Haller, Elle est liée à SSN grâce à une architecture de modularisation horizontale et verticale. Cette ontologie suit le patron de conception de l'ontologie SSN en ajoutant de nouvelles classes et propriétés pour les

, Cette propriété pointe sur une unité "nombre de parcelles". La propriété qu:numericalValue relie l'échantillon à une valeur xsd :double. Pour préciser la date des observations, nous avons employé la propriété sosa:phenomenonTime pour lier une observation à une, Nous avons utilisé qu:unit pour représenter les unités associées aux échantillons

, Annotations attendues Nous présentons dans ce qui suit les annotations attendues à partir du texte présenté en exemple plus haut. Nous présentons ces annotations en précisant les calculs nécessaires pour l'automatisation de leur génération à partir de texte

, Ainsi par exemple, il faut reconnaître que « 53 parcelles » fait référence à une instance de sosa:Sample et donnera lieu à la création de <irstea:sample_ParcellesColza_Bourgogne_53>. Le nommage des URI nécessite une prise en compte du contexte ainsi qu'une structuration et typage de l'information (par exemple Région/Culture/unité/sample/nombre pour l'exemple précédent). Voici les annotations qui devraient être obtenues : <irstea:sample_ParcellesColza_Bourgogne_53> rdf:type sosa:Sample. <irstea:obs_parcelles_colza_bourgogne_stadeDeveloppement_20110405> rdf:type sosa:Observation, Repérage des instances d'entités sémantiques Le repérage des instances d'entités revient à un problème classique de reconnaissance de termes et d'entités nommées

, Structuration des informations extraites Certaines annotations nécessitent de structurer l'information et de reconnaître les types des entités extraites. Il est, par exemple, nécessaire de repérer les valeurs numériques et l'unité. <irstea:sample_ParcellesColza_Bourgogne_53> hasCropProfile <FrenchCropUsage:Colzas>

, Le typage permet d'effectuer des calculs. Cela est le cas par exemple pour retrouver que 2%

, de 53 parcelles fait référence à une seule parcelle. Le repérage du pourcentage permet de déduire 7. Les instituts techniques agricoles

, le nombre de parcelles concernés par l'observation sans que cela soit mentionné explicitement dans le texte

, prov:wasDerivedFrom <irstea:sample_ParcellesColza_Bourgogne_53>

, Détection de relations

, Il s'agit de mettre en lien les entités annotées. Comme par exemple lier le stade de développement à l'échantillon concerné. <irstea:obs_parcelles_colza_bourgogne_stadeDevelopement_20110405> sosa:hasResult <acta:colzaStadeDevelopment/D1>

, Nous allons mettre en place l'automatisation des annotations à partir de textes en définissant des heuristiques utiles pour l'extraction. L'automatisation des annotations nécessitent une segmentation préalable des BSV selon la culture et une définition de contextes pour l'extraction afin de réduire le bruit. Nous avons commencé à utiliser l'outil OMTAT, qui permet une annotation automatique ou manuelle de textes, et comptons l'enrichir par les heuristiques propres à notre domaine. Notre objectif est de généraliser l'annotation à partir de textes à d'autres types d, Conclusion Nous avons présenté la méthodologie de construction d'un schéma d'annotation des observations dans les bulletins de santé du végétal et les annotations RDF qui en découlent

, Remerciements Ce travail a bénéficié partiellement d'une aide de l'État gérée par l'Agence Nationale de la Recherche au titre du programme « Investissements d'Avenir » portant la référence

A. A. Références and . Zweigenbaum-p, Annotation et interrogation sémantiques de textes médicaux, 2010.

, Portail de données pour l'innovation en agriculture

. Brickley-d.-&amp;-miller-l, Foaf vocabulary specification 0, p.91, 2007.

. Haller-a, K. Janowicz, . Cox-s, . L. Phuoc-d, and . Taylor-k.-&amp;-lefrançois-m, Semantic sensor network ontology, 2017.

. Lefort-l, Ontology for quantity kinds and units : units and quantities definitions, 2011.

. Miles-a, . Matthews-b, . &. Wilson-m, and . Brickley-d, Skos core : simple knowledge organisation for the web, International Conference on Dublin Core and Metadata Applications, pp.3-10, 2005.

C. Roussey and . Bernard-s, Annotation des bulletins de santé du végétal, Actes de la 7ème édition de l'Atelier Recherche d'Information SEmantique (RISE), p.12, 2015.

C. Roussey, . Bernard-s, F. Pinet, and . Reboud-x.-&amp;-cellier-v, Gestion sémantique des bulletins de santé du végétal dans le projet vespa, Actes de l'atelier IN-OVIVE @IC, p.12, 2016.

. Segaran-t, C. Evans, J. Taylor, T. S. , and C. E. Jamie-t, Programming the semantic web, 2009.

T. L. Satya-s.-&amp;-deborah-m, Prov-o : The prov ontology, 2013.

, Web annotation data model, p.3, 2014.

H. Zargayouna and . Roussey-c.-&amp;-chevallet-j.-p, Recherche d'information sémantique : état des lieux, Traitement Automatique des Langues, vol.56, issue.3, pp.49-73, 2015.