Categorías
Natural Language Processing

Convierta los verbos a la forma base usando Wordnet en Java

Un verbo puede aparecer en una oración en varios formatos, como forma base, tiempo pasado, participio pasado, presente en tercera persona del singular, etc. Para tener una idea general de cómo ocurre cada palabra, a menudo necesitamos obtener la forma base de una palabra.

Este ejemplo muestra cómo convertir un verbo a su forma básica utilizando la API de Java para Wordnet – JAWS. Haré esto en el entorno eclipse y Ubuntu.

1. Cree un proyecto Java llamado «TestJAWS» en su espacio de trabajo.

2. Vaya a Wordnet (http://wordnet.princeton.edu/wordnet/download/current-version/) y descargue «tar-gzipped: WordNet-3.0.tar.gz».

Nota: no es solo un archivo de base de datos.

3. Descomprímalo y copie dict direction en su espacio de trabajo, digamos «/ home / mike / somedir / dict /». El directorio «dict» debe contener los siguientes archivos:

4. Descargue el archivo jar de JAWS: http://lyle.smu.edu/~tspell/jaws/jaws-bin.jar y agréguelo a la ruta de construcción de su proyecto. (haga clic con el botón derecho en el proyecto -> Ruta de compilación -> Configurar ruta de compilación -> Bibliotecas -> agregar jarras externas -> listo)

5. El siguiente es el código para encontrar la forma base del verbo «implements»

public static void main(String[] args) {
 
		System.setProperty("wordnet.database.dir", "/home/.../wordnet/dict/");
		WordNetDatabase database = WordNetDatabase.getFileInstance();
 
		Morphology id = Morphology.getInstance();
 
		String[] arr = id.getBaseFormCandidates("implements", SynsetType.VERB);
 
		System.out.println(arr.length);
 
		for(String a: arr)
			System.out.println(a);
 
	}
  Calcular la similitud de palabras usando Wordnet en Java

Si tiene curiosidad sobre qué otras cosas puede hacer JAWS, vaya a JAWS Java Doc: http://lyle.smu.edu/~tspell/jaws/doc/overview-summary.html.

Por Programación.Click

Más de 20 años programando en diferentes lenguajes de programación. Apasionado del code clean y el terminar lo que se empieza. ¿Programamos de verdad?

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *