Evaluación de la extracción de entidades nombradas de OpenCalais en castellano Articles uri icon

publication date

  • September 2010

start page

  • 287

end page

  • 290

issue

  • 45

International Standard Serial Number (ISSN)

  • 1135-5948

Electronic International Standard Serial Number (EISSN)

  • 1989-7553

abstract

  • En los últimos años se han popularizado herramientas de Extracción de Información comerciales dentro del ecosistema de servicios de la Web Semántica. OpenCalais ofrece actualmente reconocimiento y categorización de Entidades Nombradas en castellano de fácil integración en aplicaciones de PLN. Hemos evaluado esta herramienta de anotación de entidades en el corpus de noticias CoNLL 2002. OpenCalais obtiene valores de precisión aceptables en las principales clases (persona, lugares y organización). Sin embargo, en comparación con los prototipos de investigación en castellano puede mejorar la cobertura y el tratamiento de la ambigüedad.

subjects

  • Computer Science

keywords

  • reconocimiento y clasificación de entidades nombradas; evaluación; extracción de información; web semántica; castellano