Primera aproximación para la extracción automática de Entidades Nombradas en corpus de documentos medievales castellanos Articles uri icon

authors

  • IGLESIAS MORENO, MARIA EUGENIA
  • AZCARATE AGUILAR-AMAT, MARIA PILAR
  • SANCHEZ CUADRADO, SONIA

publication date

  • April 2014

start page

  • 229

end page

  • 238

volume

  • ANEXO 1

Electronic International Standard Serial Number (EISSN)

  • 2254-7290

abstract

  • En este artículo presentamos los resultados de una evaluación de la anotación de nombres propios de forma automática en un corpus de documentación medieval castellana. Dicha evaluación se ha realizado sobre el etiquetado obtenido con la herramienta de procesamiento de lenguaje natural, Freeling, en dos iteraciones. La primera, con la versión para español estándar y antiguo facilitadas y la segunda con una adaptación propuesta, basada en la solución de los problemas de anotación debidos a las características y variantes que presentan los nombres propios de personas y lugares en español antiguo. Para ambas iteraciones, se ha seleccionado un corpus de anotación de los documentos que componen el Libro Becerro de las Behetrías de Castilla (LBB), del siglo XIV. El nivel de acierto obtenido en la anotación automática de nombres propios con la adaptación propuesta ha sido de 98,23% para el español antiguo, que puede considerarse aceptable para repetir, en un trabajo futuro, el método en el corpus completo.