Un verbo puede aparecer en una oración en varios formatos, como forma base, tiempo pasado, participio pasado, presente en tercera persona del singular, etc. Para tener una idea general de cómo ocurre cada palabra, a menudo necesitamos obtener la forma base de una palabra.
Este ejemplo muestra cómo convertir un verbo a su forma básica utilizando la API de Java para Wordnet – JAWS. Haré esto en el entorno eclipse y Ubuntu.
1. Cree un proyecto Java llamado «TestJAWS» en su espacio de trabajo.
2. Vaya a Wordnet (http://wordnet.princeton.edu/wordnet/download/current-version/) y descargue «tar-gzipped: WordNet-3.0.tar.gz».
Nota: no es solo un archivo de base de datos.
3. Descomprímalo y copie dict direction en su espacio de trabajo, digamos «/ home / mike / somedir / dict /». El directorio «dict» debe contener los siguientes archivos:
4. Descargue el archivo jar de JAWS: http://lyle.smu.edu/~tspell/jaws/jaws-bin.jar y agréguelo a la ruta de construcción de su proyecto. (haga clic con el botón derecho en el proyecto -> Ruta de compilación -> Configurar ruta de compilación -> Bibliotecas -> agregar jarras externas -> listo)
5. El siguiente es el código para encontrar la forma base del verbo «implements»
public static void main(String[] args) { System.setProperty("wordnet.database.dir", "/home/.../wordnet/dict/"); WordNetDatabase database = WordNetDatabase.getFileInstance(); Morphology id = Morphology.getInstance(); String[] arr = id.getBaseFormCandidates("implements", SynsetType.VERB); System.out.println(arr.length); for(String a: arr) System.out.println(a); } |
Si tiene curiosidad sobre qué otras cosas puede hacer JAWS, vaya a JAWS Java Doc: http://lyle.smu.edu/~tspell/jaws/doc/overview-summary.html.