Ingeniería lingüística

Cómo aprovechar la fuerza del lenguaje

Ingeniería lingüística
DE EN FR

Índice


La lengua en la actualidad

El lenguaje en acción

La lengua es el medio natural de comunicación entre personas; el modo más eficaz de que disponemos para comunicarnos con los demás. La utilizamos de muy diversas maneras: para explicar ideas y conceptos complejos; para gestionar recursos humanos, negociar, convencer, dar a conocer nuestras necesidades; para expresar nuestros sentimientos, contar historias, transmitir nuestra cultura a las generaciones venideras, y para crear belleza a través de la poesía y de la prosa. La lengua es para la mayoría de nosotros fundamental en todos los aspectos de nuestras vidas.

La utilización de la lengua sufre, sin embargo, restricciones. En general, se utiliza sólo en las comunicaciones directas entre seres humanos y no en nuestra interacción con los sistemas, servicios y aplicaciones que utilizamos en la vida cotidiana. Incluso entre las personas, el entendimiento suele limitarse a aquellos grupos que comparten una lengua común, de modo que la lengua puede a veces considerarse más un obstáculo que una ayuda a la comunicación.

En nuestros días tiene lugar un cambio que va a revolucionar la utilización de la lengua y que aumentará considerablemente su valor en todos los aspectos de la comunicación. Dicho cambio es el resultado de los avances en ingeniería lingüística.

La ingeniería lingüística proporciona medios de ampliar y mejorar la utilización de la lengua, para hacer de ella una herramienta más eficaz. Se basa en los vastos conocimientos sobre las lenguas y su funcionamiento acumulados por la investigación. Utiliza recursos lingüísticos como los diccionarios y gramáticas electrónicas y los bancos y corpus terminológicos elaborados a lo largo del tiempo. La investigación nos dice lo que necesitamos saber sobre las lenguas y perfecciona las técnicas necesarias para comprenderlas y manipularlas. Los recursos representan la base de conocimientos necesaria para reconocer, validar, comprender y manipular las lenguas utilizando la potencia de los ordenadores. La aplicación de estos conocimientos lingüísticos nos permite crear nuevas maneras de solucionar problemas que se plantean en los ámbitos político, social y económico.

La ingeniería lingüística es una tecnología que utiliza nuestros conocimientos de la lengua para mejorar la utilización de los sistemas informáticos:

Merced al creciente conocimiento de la lengua, surgen nuevas oportunidades de cambiar la forma en que hacemos muchas cosas, para que resulten más fáciles y eficaces.

Cuando, además de aceptar datos mecanografiados, una máquina pueda reconocer la escritura natural y la voz en varias lenguas, podremos disfrutar mejor de los beneficios de una vasta gama de servicios de información y comunicación, así como de la posibilidad de realizar operaciones comerciales a distancia por teléfono o mediante otros servicios telemáticos.

Cuando una máquina comprenda el lenguaje humano, traduzca entre varias lenguas y genere resultados orales e impresos, dispondremos de una herramienta poderosísima que nos ayudará en muchos ámbitos de nuestras vidas.

Cuando una máquina pueda ayudarnos a entender mejor y más rápido a los demás, podremos cooperar y colaborar con mayor eficacia tanto en las cuestiones económicas como en las políticas.

La ingeniería lingüística tendrá éxito cuando haga realidad todas estas posibilidades. No obstante, algunas de estas cosas pueden hacerse ya, aunque requieren un mayor perfeccionamiento. El ritmo del progreso se acelera y en los próximos años asistiremos a muchos avances.


La lengua es fundamental

La lengua constituye un eficaz medio de comunicación. Es también un medio para registrar y asimilar información y, en la práctica, la manera más conveniente de representar la mayor parte de la información que necesitamos. La lengua es vital tanto para nuestras actividades económicas como para nuestra administración. Es también muy importante en muchos de los aspectos sociales, culturales y políticos de nuestras vidas. La lengua forma parte integrante de nuestra cultura y nos ayuda a tener una identidad propia.

Para todos nosotros, la propia lengua es fundamental desde el punto de vista de la identidad nacional y de la cultura. La lengua tiende un puente con nuestras tradiciones y proporciona la base de nuestra educación y nuestro ocio.

En Europa disfrutamos de una gran variedad de lenguas y culturas que nos permiten aprender mucho sobre los modos de vida de los otros, lo cual constituye una de las bases para la cohesión de la sociedad europea. Si las ventajas de una sociedad multilingüe han de ser uno de los rasgos del modo de vida europeo, debemos, sin embargo estudiar la manera de superar los obstáculos a la comunicación y a la comprensión que conlleva dicho rasgo.

A veces se dice que en las actividades económicas, administrativas y políticas de ámbito internacional basta con utilizar una o dos lenguas, lo que en cierta medida es cierto. No obstante, esta circunstancia podría no ser del todo satisfactoria. El predominio de unas pocas lenguas podría originar un desequilibrio de poder inaceptable y una pobre utilización de los recursos.

Sobre todo, reduciría de manera significativa el número de personas que pueden participar en cualquier actividad, lo que forzosamente lleva ala exclusión de contribuciones valiosas y al descontento. Con el tiempo, un planteamiento de este tipo marginaría también a las lenguas menos extendidas, reduciendo aún más su ámbito de utilización y disminuyendo inevitablemente la riqueza y la variedad de nuestra cultura. Por último, afectaría desfavorablemente no sólo a nuestro sentido de la identidad nacional, regional y cultural, sino al de pertenecer a una auténtica sociedad europea que tolera y apoya a sus minorías reconociendo su valor.

Un planteamiento tan restrictivo del uso de la lengua también podría limitar la disponibilidad de una amplia gama de importantes servicios y medios nuevos, negando a muchas personas la posibilidad de utilizar los sistemas informáticos en su propia lengua.

Habida cuenta de nuestros esfuerzos para colaborar cada vez más, para crear un mercado único comparable con el nacional, tenemos el incentivo especial de encontrar soluciones a los problemas que plantea un mercado multilingüe. Si atiende con éxito a nuestras propias necesidades lingüísticas, especialmente en los campos de la economía, la administración y la educación, la ingeniería lingüística nos ayudará a competir en el mercado mundial. Por un lado, nuestras empresas tendrán una ventaja competitiva gracias a su experiencia en la utilización de la tecnología para satisfacer las necesidades de un mercado multilingüe. Por otro, dispondremos también de productos lingüísticos para vender al resto del mundo.

Una de las características más importantes de la sociedad de la información será el aprendizaje a lo largo de toda la vida. Asimismo, todo el mundo conviene en que los gestores del futuro deberán dominar más de una lengua. La ingeniería lingüística contribuirá mucho al desarrollo de los sistemas de formación personal, no sólo para el aprendizaje de lenguas sino también en lo tocante a una mejor adaptación a las necesidades del estudiante.

Los productos lingüísticos mejorarán el rendimiento tanto de las empresas y administraciones como de los particulares. Los productos creados por medio de las tecnologías de la lengua revolucionarán nuestros métodos e incrementarán la gama de servicios para empresas, administraciones y el público en general.

El reconocimiento, comprensión y generación del habla por ordenador hará más eficaz y humana la interacción entre las personas y los ordenadores. Las máquinas entenderán el lenguaje natural y satisfarán nuestras necesidades de información con más precisión y sensibilidad, ayudándonos a superar el problema del exceso de información.

Los servicios de traducción asistida por ordenador y la generación de documentos en lenguas extranjeras no sólo mejorarán nuestros negocios en Europa sino que también contribuirán a ampliar nuestros mercados exteriores.


La lengua a nuestro servicio

En nuestra capacidad para desarrollar la utilización de la lengua reside la clave de la sociedad de la información multilingüe, de la sociedad europea del futuro. Los nuevos avances en ingeniería lingüística nos permitirán:


Técnicas y recursos

¿Qué es la ingeniería lingüística?

La ingeniería lingüística es la aplicación de los conocimientos sobre la lengua al desarrollo de sistemas informáticos que puedan reconocer, comprender, interpretar y generar lenguaje humano en todas sus formas. En la práctica, la ingeniería lingüística consiste en una serie de técnicas y recursos lingüísticos, que se aplican, en el primer caso, por medio de programas informáticos y que, en el segundo, constituyen una fuente de conocimientos a los que se puede acceder por medio de programas informáticos.


Componentes tecnológicos

Los procesos básicos de la ingeniería lingüística se muestran en la página siguiente. Consisten fundamentalmente en:

Modelo de sistema con capacidad lingüística

Modelo de sistema con capacidad lingüística

Dentro de este modelo general pueden darse, por supuesto, muchas configuraciones diferentes. La aplicación de una tecnología determinada decidirá cuáles de los componentes anteriores son necesarios.


Técnicas

A continuación se describen algunas de las múltiples técnicas que se utilizan en ingeniería lingüística.


Identificación y verificación del locutor

La voz humana es, como las huellas dactilares, única para cada persona. Por esta razón, se puede identificar a un hablante determinado, lo que permite comprobar que la persona está autorizada a acceder a un servicio o recurso. Esta técnica plantea una serie de problemas como, por ejemplo, reconocer que la voz no está grabada, discriminar la voz del ruido (ambiental o del medio de transferencia) y efectuar la identificación con fiabilidad independientemente de los cambios temporales (por ejemplo, los causados por una enfermedad).


Reconocimiento del habla

Un ordenador recibe el sonido de la voz en forma de ondas analógicas, que se analizan para identificar las unidades de sonido (denominadas fonemas) constitutivas de las palabras. Se utilizan modelos estadísticos de fonemas y palabras para reconocer la introducción de datos orales discretos o continuos. La producción de modelos estadísticos de calidad requiere disponer de amplias muestras de entrenamiento (corpus). Con este fin, se han recogido ya y se seguirán recogiendo una amplia gama de corpus orales.

No obstante, deberán superarse muchísimos problemas para que el habla llegue a utilizarse de manera generalizada como medio para comunicar con un ordenador. El primero de ellos es la capacidad de reconocer el habla continua en lugar de enunciados discurso emitidos deliberadamente por el hablante en forma de palabras independientes separadas con una pausa. El problema siguiente es reconocer a cualquier hablante, evitando la necesidad de entrenar al sistema en el reconocimiento de la voz de una persona determinada. Se da asimismo el grave problema de la interferencia del ruido, procedente del entorno en el que el hablante utiliza el sistema o del propio ruido producido por el medio de transmisión, por ejemplo, la línea de teléfono. La reducción del ruido, la potenciación de la señal y el reconocimiento de palabras clave pueden utilizarse para conseguir un reconocimiento claro y preciso en ambientes ruidosos o redes de telecomunicaciones. Por último, existe el problema de los acentos, dialectos y del lenguaje hablado que, con frecuencia, no responde a las normas recogidas en las gramáticas de la lengua escrita.


Reconocimiento de caracteres e imágenes

El reconocimiento de textos escritos o impresos exige obtener una representación simbólica de la lengua a partir de la forma espacial de sus símbolos gráficos. En la mayoría de las lenguas esto significa reconocer y transformar caracteres. Hay dos tipos de reconocimiento de caracteres:

El ROC puede lograr, a partir de una familia de fuentes de imprenta, un elevado nivel de precisión. Los problemas vienen cuando la fuente se desconoce o es excesivamente decorativa, o cuando la calidad de la impresión es mala. En estos casos de dificultad, así como en el caso de la escritura, sólo pueden obtenerse buenos resultados utilizando el RIC. El RIC consiste en técnicas de reconocimiento de las palabras que utilizan modelos lingüísticos, tales como léxicos o información estadística sobre las secuencias de palabras.

El análisis de imágenes documentales está estrechamente relacionado con el reconocimiento de caracteres, pero implica el análisis del documento para determinar en primer lugar cómo se han compaginado gráficos, fotografías, líneas de separación y texto, y, luego, de la estructura del texto para distinguir los títulos, subtítulos, leyendas, etc., a fin de procesar el texto correctamente.


Comprensión del lenguaje natural

Es obvio que la comprensión del lenguaje resulta fundamental en muchas aplicaciones. No obstante, una perfecta comprensión no es siempre imprescindible. De hecho, conseguir una comprensión parcial suele ser un primer paso de gran utilidad, porque permite seleccionar con inteligencia el grado de comprensión de los distintos niveles.

El análisis superficial o parcial de los textos se utiliza para conseguir una sólida clasificación inicial de textos sin restricciones. El análisis inicial puede utilizarse luego, por ejemplo, para centrarse en partes "interesantes" de un texto con vistas a un análisis semántico más profundo que determine el contenido del texto dentro de un dominio delimitado. Puede utilizarse también, conjuntamente con los conocimientos estadísticos y lingüísticos, para determinar automáticamente las características lingüísticas de las palabras desconocidas, que pueden luego añadirse a los conocimientos del sistema.

Los modelos semánticos se utilizan para representar el significado de la lengua en términos de conceptos y de las relaciones existentes entre ellos. Un modelo semántico puede utilizarse, por ejemplo, para representar una solicitud de información con un significado básico independiente de la terminología o la lengua en que se haya realizado la consulta. Así se posibilita el acceso multilingüe a la información sin necesidad de estar familiarizado con la terminología o la estructura empleadas para indizar la información.

La combinación de análisis y generación con un modelo semántico permite la traducción de textos. En el estado actual de los conocimiento, las aplicaciones de traducción de textos exigen vocabularios y conceptos limitados para que puedan utilizarse los recursos de ingeniería lingüística adecuados. Con vistas a la generación de textos de gran calidad pueden utilizarse plantillas para la estructura de los documentos y frases comunes con partes variables.


Generación de lenguaje natural

Es posible utilizar la representación semántica de un texto como base para la generación de lenguaje. Una interpretación de datos básicos o el significado subyacente de una oración o frase pueden representarse en una cadena superficial de manera preestablecida, tanto en una lengua determinada como en función de las indicaciones de carácter estilístico de un sistema de planificación de textos.


Generación de habla

El habla se genera a partir de plantillas rellenadas, mediante la reproducción de grabaciones "enlatadas" o concatenando unidades de habla (fonemas, palabras). El discurso generado tiene que tener en cuenta aspectos como la intensidad, duración y acento para producir una respuesta continua y natural.

El diálogo puede establecerse combinando el reconocimiento del habla con la simple generación, a partir de la concatenación de elementos del habla humana almacenados o sintetizando las reglas del discurso.

Una biblioteca de sistemas de reconocimiento y generación de habla, junto con una herramienta gráfica para estructurar su aplicación, permite a quienes no sean expertos en tratamiento del habla ni programadores informáticos diseñar un dialogado estructurado que puede utilizarse, por ejemplo, para la gestión automatizada de las llamadas telefónicas.


Recursos lingüísticos

Los recursos lingüísticos son un elemento esencial de la ingeniería lingüística. Constituyen una de las principales formas de representar el conocimiento de la lengua, que se utiliza en los trabajos de análisis conducentes al reconocimiento y la comprensión.

El trabajo de producir y mantener recursos lingüísticos es una tarea descomunal. De la producción de los recursos se encargan centros de investigación e instituciones públicas, con arreglo a formatos y protocolos normalizados que permiten utilizarlos en muchas de las lenguas de la UE. La Asociación Europea de Recursos Lingüísticos (ELRA, "European Language Resources Association") produce buena parte de estos recursos.


Léxicos

Un léxico es un depósito de palabras y de conocimientos sobre ellas. Entre estos se cuentan informaciones sobre la estructura gramatical de cada palabra (morfología), la estructura fonética (fonología), el significado de la palabra en diferentes contextos textuales, por ejemplo, en función de la palabra o del símbolo de puntuación que esté antes o después de ella. Para ser útil, un léxico debe tener cientos de miles de entradas. Son necesarios para cada lengua de aplicación.


Léxicos especializados

Existen algunos casos especiales de léxicos que se suelen investigar y producir independientemente de los léxicos de carácter general:

Nombres propios: Los diccionarios de nombres propios son esenciales para una comprensión eficaz de la lengua, al menos para que estos puedan ser reconocidos dentro de su contexto como lugares, objetos, personas o incluso animales. En muchas aplicaciones adquieren un significado especial, cuando el nombre es fundamental para la aplicación, por ejemplo, en el caso de los sistemas de navegación por voz, los sistemas de reserva de vacaciones o la información de los horarios de ferrocarril, que se basan en la gestión automática de las llamadas telefónicas.

Terminología: En el complejo entorno tecnológico de nuestros días existe una multitud de términos que es preciso registrar, estructurar y poner a disposición de las aplicaciones lingüísticas. Muchas de las aplicaciones más productivas de la ingeniería lingüística, como la gestión de documentos técnicos multilingües y la traducción automática, dependen de que se disponga de los bancos terminológicos apropiados.

Redes de palabras (wordnets): Las redes de palabras describen las relaciones existentes entre las palabras, por ejemplo, los sinónimos, antónimos, sustantivos colectivos, etc. Tienen un gran valor para aplicaciones como la búsqueda de información, las herramientas integradas de apoyo a la traducción y los sistemas ofimáticos inteligentes de creación.


Gramáticas

Las gramáticas describen la estructura de una lengua a diversos niveles: palabra (gramática morfológica), frase, oración, etc. Las gramáticas pueden tratar la estructura en términos formales (sintaxis) y de significado (semántica y discurso).


Corpus

Un corpus es una muestra amplia de lengua escrita o hablada, que proporciona las bases para:

  • analizar la lengua y determinar sus características
  • entrenar a las máquinas, por lo general para adaptar su comportamiento a circunstancias específicas
  • verificar empíricamente una teoría lingüística
  • ensayar una técnica o aplicación de ingeniería lingüística a fin de determinar su buen funcionamiento en la práctica.

    Existen corpus nacionales que contienen cientos de millones de palabras, pero se trata de corpus construidos para fines concretos. Por ejemplo, un corpus puede contener grabaciones de conductores de automóvil para simular un sistema de control capaz de reconocer órdenes verbales, que sirve después para determinar los necesidades de los usuarios con vistas a su producción comercial.


    La cadena de desarrollo y aplicación

    El diagrama de la página siguiente muestra la cadena de actividades de la ingeniería lingüística, desde la investigación hasta la entrega de productos y servicios lingüísticos a los usuarios finales. El proceso de investigación y desarrollo conduce a la creación de técnicas, la producción de recursos y el establecimiento de normas, que constituyen los bloques de construcción básicos.

    Modelo de actividades de ingeniería lingüística

    Modelo de actividades de ingeniería lingüística

    En términos prácticos, la ingeniería lingüística se aplica en dos niveles. En el primer nivel, existen diversas clases genéricas de aplicaciones, a saber:

    En el segundo nivel, estas aplicaciones generadoras se aplican a los problemas del mundo real en todo el espectro social y económico. Así, por ejemplo:

    Por lo general, la capacidad lingüística se añade a los sistemas para incrementar su rendimiento. La ingeniería lingüística es en este sentido 'una tecnología generadora'.


    La repercusión de la ingeniería lingüística

    Las tecnologías de la lengua pueden aplicarse a una amplia gama de problemas en el ámbito de la empresa y de la administración para conseguir soluciones mejores y más eficaces. Pueden utilizarse asimismo en la educación, para ayudar a los discapacitados, y para ofrecer nuevos servicios tanto a las entidades como a los consumidores. A continuación se mencionan las áreas en que tienen un impacto significativo:


    Competencia en el mercado mundial

    El éxito empresarial depende cada vez más de la capacidad de competir en un mercado de ámbito mundial. El éxito se basa en la capacidad de descubrir mercados, vender en ellos con eficacia y proporcionar un servicio posventa con la calidad que esperan los clientes. La ingeniería lingüística puede, en muchos campos, aumentar la eficacia y reducir los costes, mediante las aplicaciones siguientes:


    Mejor información

    Una de las características claves de los servicios de información es su capacidad de suministrar una información que cubra de forma selectiva las necesidades inmediatas y reales del cliente. No basta con proporcionar una información que entre más o menos dentro de la categoría solicitada, de modo que el cliente tenga que cribarla para extraer lo que le sea útil. Del mismo modo, si un método utilizado para obtener la información presenta omisiones importantes, los resultados serán en el mejor de los casos inadecuados; y en el peor, podrían inducir a engaño.

    La información está disponible en todas partes en idiomas diferentes como ocurre, por ejemplo, en la World Wide Web. En realidad, sin embargo, sólo puede acceder a ella el cliente que solicite la información en la lengua en que esté registrada y, además, comprenda el idioma en que se presenta. Mediante la traducción automática, la persona podrá solicitar la información en su propio idioma y recibirla en la misma lengua, con independencia del idioma en que se haya registrado.

    La ingeniería lingüística puede mejorar la calidad de los servicios por medio de técnicas que no sólo respondan a las solicitudes de información con resultados más precisos, sino que además aumenten considerablemente la posibilidad de encontrar toda la información pertinente. La utilización de técnicas como la búsqueda de conceptos, que consiste en adaptar los criterios de búsqueda a los contenidos de las bases de datos mediante el análisis semántico de ambos, proporciona resultados mucho mejores que la simple búsqueda por palabras.

    Uno de los principales beneficios de la sociedad de la información para el ciudadano será la mejora de los servicios públicos de información. Sin embargo, la generalización del acceso a dicha información dependerá de la ingeniería lingüística. Las personas que no estén acostumbradas a utilizar interfaces de ordenador podrán pedir información simplemente hablando a la máquina y el sistema les guiará a través de todas las opciones posibles. Quienes deseen información sobre otros países podrán recibirla en su propio idioma aunque esté originariamente en un idioma extranjero. Un buen ejemplo de lo anterior es el proyecto de servicio para informar sobre los puestos de trabajo en la Unión Europea en el idioma nativo del solicitante. Como es natural, se trata de trabajos en los que la capacidad lingüística no es importante. El servicio se prestará a través de Internet. Asimismo, las personas que buscan empleo dispondrán de cabinas públicas para utilizarlo. En una experiencia piloto de carácter multilingüe que se llevó a cabo en Flandes, se obtuvo una respuesta sorprendente: el 26% de las solicitudes de trabajo procedían de personas que habían visto la información en Internet.

    La contribución de la ingeniería lingüística se notará en numerosísimos campos de interés público. La recogida de información con fines policiales es un caso interesante. Por ejemplo, existe una gran cantidad de información para detectar delitos de contrabando, que procede tanto de fuentes públicas como comerciales. Si se presenta y se reúne de la manera adecuada, puede proporcionar indicios claros de la actividad sospechosa. La información sobre el movimiento de los barcos, los manifiestos de carga y la información empresarial pueden revelar indicios de actividad irregular. La capacidad de los análisis lingüísticos para reproducir este tipo de indicios constituye una importante ayuda.


    Acceso directo a los servicios

    En los últimos años se ha producido la explosión de los servicios por teléfono, como en el caso de la banca, los seguros y la asistencia técnica. La ventaja de este tipo de servicio es que se proporciona al cliente una respuesta rápida "las 24 horas del día". Desde el punto de vista del proveedor, el servicio resulta rentable porque no es preciso disponer de costosos locales para realizar la actividad. La utilización de las técnicas de identificación de los hablantes y reconocimiento del habla permite automatizar muchos de estos servicios. Puede atenderse la llamada telefónica de un cliente por medio de un ordenador capaz de mantener un diálogo inteligible con la persona que llama, así como de prestar el servicio a satisfacción del cliente. Tal vez el ejemplo más claro en la actualidad sea la automatización de los servicios bancarios por teléfono que ofrecen ya muchos bancos. El cliente, cuando llama al servicio, recibe la respuesta de un ordenador que, en primer lugar, analiza las características de su voz para identificarla y comprobar si está autorizado a utilizar el servicio. A continuación se establece un diálogo entre el cliente y el ordenador para determinar los servicios solicitados y realizar cualquier tipo de transacción como, por ejemplo, pagar una factura, extender un certificado, etc. Pueden citarse también otros ejemplos, como la reserva de entradas para el teatro, de billetes de ferrocarril, barco o avión y las compras a través de la televisión por cable.

    Aparte de la ventajas económicas que supone proporcionar servicio a todas horas del día, los servicios automáticos hacen innecesarios los horarios de trabajo largos y asociales para proporcionar cobertura. Los servicios son seguramente más coherentes, rápidos y fiables. Por último, la grabación automática deja un registro que asegura a cada una de las partes sobre el resultado de la transacción.


    Acceso al mercado

    Muchas de las partes de una operación comercial, como efectuar el pedido, facturar y enviar las instrucciones de pago al banco pueden realizarse sin necesidad de intervención humana, utilizando por ejemplo la tecnología IED (intercambio electrónico de datos). Hoy por hoy, sin embargo, la mayoría de las operaciones dan comienzo con un diálogo entre personas por teléfono, por escrito o cara a cara. Con la mejora de los servicios telemáticos y la creciente utilización de Internet y la World Wilde Web, ha aumentado la posibilidad de automatizar un mayor número de actividades del ciclo comercial (véase la ilustración siguiente). Los programas con capacidad lingüística desempeñarán un papel destacado al facilitar y hacer más eficaz la automatización.

    El ciclo comercial

    El ciclo comercial

    Para el usuario, una de las ventajas de la World Wide Web es que la información se publica en lenguaje natural. Sin embargo, para que un programa informático busque y seleccione información en la Web, es preciso que pueda comprender la información publicada y adaptarla a las necesidades del usuario. La ingeniería lingüística puede contribuir de manera significativa al perfeccionamiento de programas inteligentes que faciliten a los consumidores la utilización de los medios de comercio electrónico. De viva voz, el consumidor podría ordenar a este tipo de programas que navegara por la Web o cualquier servicio similar leyendo los catálogos u otros productos seleccionados para buscar y negociar precios, incluso haciendo ofertas en subastas electrónicas. Una vez estudiados los resultados, el consumidor ordenaría al programa que hiciese el pedido y, tras la entrega, daría instrucciones a su banco para abonar la factura electrónica. Los usuarios no tendrían que conocer la complejidad de las operaciones comerciales realizadas por el programa.

    Los servicios posventa pueden mejorarse también utilizando servicios de asistencia electrónicos, que utilicen las técnicas de hipertexto y otros medios con capacidad lingüística. Los beneficios de la automatización son enormes. Aparte de la reducción de los costes en todo el ciclo comercial, podrá evaluarse la idoneidad de una amplia gama de suministradores y productos, lo cual fomentará la competitividad de los precios. El proceso en su conjunto será más rápido y eficaz y, una vez que se haya registrado la información pertinente, podrá garantizarse la precisión de todos los procesos relacionados con éste.

    Con el tiempo, el comercio electrónico cambiará el propio modelo económico. Cada vez serán menos necesarios los intermediarios. Nuevas empresas pequeñas pondrán en conocimiento de todo el mundo sus productos y servicios con rapidez, eficacia y sin demasiados costes. No obstante, sin entender idiomas y sin capacidad multilingüe no se podrán aprovechar íntegramente tales beneficios.


    Comunicación eficaz

    Tal vez sea la comunicación la utilización más evidente de la lengua. Sin embargo, la lengua es también el obstáculo más claro para la comunicación. Cotidianamente surgen dificultades entre las diversas culturas y naciones, no sólo por el problema de traducir con precisión de una lengua a otra, sino también por las connotaciones culturales de frases y palabras. Un ejemplo característico en el contexto europeo es la palabra "federal", que para el súbdito de una federación significa una forma de gobierno basada en la transferencia de competencias; en cambio, para el de un estado unitario significará probablemente la imposición de otro nivel de administración más lejano y centralizado.

    Cuando la aplicación de los conocimientos lingüísticos permita dar un mejor apoyo a los traductores, por medio de diccionarios electrónicos, tesauros y otros recursos lingüísticos y cuando finalmente se haga realidad una traducción automática de gran calidad, los obstáculos disminuirán. Los acuerdos de todo tipo, políticos o comerciales, se redactarán mejor y con mayor rapidez en varias lenguas. El trabajo internacional será más eficaz y podrá contribuir a él un mayor número de personas. Un ejemplo de proyecto que está contribuyendo con éxito a mejorar las comunicaciones en Europa es la interconexión de las fuerzas policiales del norte de Europa a través de un lenguaje controlado y delimitado, que puede traducirse automáticamente en tiempo real. Este tipo de sistemas no sólo contribuye a prevenir y detectar los delitos internacionales, sino que además ayuda a los servicios de urgencia a comunicarse eficazmente cuando se produce un incidente grave.


    Accesibilidad y participación

    Uno de los campos en que la ingeniería lingüística tendrá mayor repercusión es en la utilización del lenguaje humano, especialmente el habla, para dialogar con las máquinas. La interconexión a través de la voz amplía la utilidad de los sistemas y servicios. Asimismo contribuirá a que los servicios sean utilizados no sólo por quienes conocen la informática sino también por el hombre de la calle sin conocimientos especiales. Este aspecto de la accesibilidad es fundamental en una sociedad democrática, abierta y equitativa de la Edad de la Información.

    Un buen ejemplo de los servicios que se prestarán son los de asesoramiento jurídico automatizados. El acceso de los ciudadanos a la justicia se está convirtiendo en un grave problema en muchas sociedades en que los costes del abogado y del proceso están sólo al alcance de los más ricos o de quienes pueden disfrutar de asistencia letrada. Será posible utilizar técnicas de carácter lingüístico no sólo para proporcionar un asesoramiento basado en la comprensión del problema y el análisis de las normas de derecho pertinentes, sino también para comprender una descripción del problema hecha en lenguaje natural y proporcionar asesoramiento, como lo haría un abogado, oralmente o por escrito. Dichos servicios podrían ponerse a disposición de los ciudadanos por medio de quioscos situados, por ejemplo, en los tribunales u oficinas de correo. Este tipo de aplicación puede utilizarse también para informar a los ciudadanos sobre las prestaciones de la seguridad social y las ofertas de trabajo, así como para proporcionar un interfaz utilizable y comprensible para que la administración resulte más abierta.

    Los sistemas capaces de comunicar de modo interactivo con sus usuarios mediante el lenguaje humano desde puntos de acceso situados en lugares públicos o desde el propio domicilio, a través de las redes telefónicas o la televisión por cable, modificarán la naturaleza de nuestras democracias. Existirá la posibilidad de participar en la toma de decisiones, gracias a la mayor disponibilidad de información presentada de forma comprensible y "objetiva", y a la posibilidad de recoger opiniones en una escala muy amplia. La aplicación de las tecnologías lingüísticas ayudará a muchas personas cuyas vidas se ven afectadas por algún tipo de discapacidad. Los ordenadores dotados de sistemas de comprensión de las lenguas, capaces de escuchar, ver y hablar, ofrecerán nuevas oportunidades para acceder a los servicios desde el hogar y participar en el lugar de trabajo.


    Mejores oportunidades para la educación

    La enseñanza a distancia se ha convertido en un aspecto importante de los servicios de educación. Es especialmente importante para el concepto de "formación continuada", que se convertirá en una característica importante de la vida en la Edad de la Información. La eficacia de la educación a distancia y del autoaprendizaje se mejorará mediante la utilización de servicios telemáticos y sistemas de enseñanza asistida por ordenador. La calidad y los resultados de la enseñanza asistida por ordenador pueden reforzarse enormemente mediante la utilización de las técnicas de ingeniería lingüística. Si el sistema de enseñanza asistida por ordenador puede comprender las respuestas de los usuarios a las preguntas, además de reconocer simplemente que la respuesta es correcta o está equivocada, podrá conducirlos por un sendero más apropiado a sus necesidades. Así, los estudiantes aprenderán con mayor eficacia y tendrán mayor capacidad de concentración, porque por propia naturaleza resultará más cómodo trabajar con un sistema más sensible.

    Mañana en Europa será esencial en muchos aspectos de la vida conocer más de un idioma. Por supuesto, la enseñanza asistida por ordenador (ELAO "Enseñanza de Lenguas Asistida por Ordenador") es un campo de primera importancia en la aplicación de la ingeniería lingüística. Los mismos conocimientos que son esenciales para que la máquina pueda comprender, constituyen la base de la enseñanza interactiva, a saber, el diagnóstico cualitativo de los errores de los estudiantes y ejemplificación de las respuestas correctas. Nuevos medios, más eficaces, de aprendizaje en casa y en el trabajo aumentarán considerablemente las oportunidades para ampliar nuestros saberes y desarrollar nuevas capacidades.


    Diversión, ocio y creatividad

    La atracción que los juegos de ordenador ejercen sobre nuestros hijos es una indicación clara del potencial de la informática para influir en nuestra cultura. La diversión doméstica puede llegar a tener un carácter más educativo, al tiempo que la educación se hace más atractiva (el concepto de "edutainment" o educación recreativa). La posibilidad de visitar entornos virtuales como museos, galerías de arte y bibliotecas proporcionarán una rica experiencia cultural al alcance de amplias capas de la sociedad desde la comodidad de sus hogares. Las visitas virtuales a estos archivos de cultura estarán asistidas por las tecnologías de la lengua, que permitirán buscar y seleccionar todas las formas de registros lingüísticos digitalizados, indizar y recuperar las imágenes, obtener el doblaje de películas y la producción automática de subtítulos, así como la traducción de los materiales contenidos en bibliotecas y archivos.

    Para capas cada vez mayores de la población, escribir puede convertirse en una actividad aún más apasionante. Las herramientas de creación harán posible resultados de mucha mayor calidad. La utilización de diccionarios en línea y de tesauros, por ejemplo, facilita la selección de las palabras exactas. Asimismo, puede verificarse la gramática. El resultado puede conducir a una experiencia más satisfactoria para aquellos escritores que no están dotados por naturaleza o cuya educación es menos completa, pero desean expresarse con eficacia en su correspondencia comercial o social.


    Beneficios

    Los beneficios que pueden obtenerse de una buena aplicación de la ingeniería lingüística son inmensos. Entre ellos se incluyen:


    Glosario

    Término Definición [s] - sigla; [n] - nombres; [g] - grupo; [v] - verbo
    alineación de texto [g]proceso de alinear diversas versiones lingüísticas de un texto para identificar términos, frases o expresiones equivalentes
    ambigüedad[n]situación en la que una palabra o una frase pueda comprenderse de diversas maneras; en el primer caso porque la palabra tiene más de un significado y en el segundo, porque la estructura de la frase puede analizarse de manera que tenga más de un significado
    análisis del discurso[g]análisis para identificar la dependencia lingüística existente entre frases
    analizador superficial[g]programa que analiza el lenguaje hasta la consecución de un nivel rudimentario de comprensión; se utiliza a menudo para determinar pasajes de texto que pueden analizarse luego con más profundidad para alcanzar un objetivo concreto
    analizar[v]estudiar la lengua para establecer su estructura y sus relaciones sintácticas y/o semánticas
    autentificación del hablante[g]verificación del hablante
    búsqueda de concepto[g]se utiliza en el contexto de la recuperación de información para significar que la búsqueda se hace utilizando un análisis semántico del filtro de búsqueda, que se coteja con un análisis semántico de la base de datos
    con capacidad lingüística[g]describe una aplicación informática cuyas funcionalidad, rendimiento y/o presentación se han mejorado mediante ingeniería lingüística
    control de versión[g]gestión de la producción, memorización y edición de documentos
    conversión de texto a habla[g]proceso de producir el enunciado oral equivalente a un texto; un ejemplo típico conversión de texto a habla son los sistemas automáticos de aviso en un aeropuerto o una estación ferroviaria
    conversión de habla a texto[g]proceso de analizar el discurso oral y producir su equivalente textual; un ejemplo típico de conversión de habla a texto son los sistemas de dictado
    corpus[n]véase corpus
    corrector de estilo[g]soporte lógico que comprueba el ajuste de un documento a una plantilla que define la estructura del texto y del documento que lo contiene; también significa la comprobación de frases o de oraciones para que se utilicen de una manera predefinida
    corrector gramatical[g]soporte lógico que comprueba la corrección gramatical de un texto
    corrector ortográfico[g]soporte lógico que comprueba la ortografía de las palabras
    diálogo[n]intercambio lingüístico bidireccional, alterno e interactivo entre dos personas, entre una persona y una máquina, o entre dos máquinas
    diccionario[n]lista de palabras con su descripción, generalmente limitada a su significado y, en ocasiones, a su etimología
    diccionario electrónico[g]diccionario (véase arriba) que puede ser leído por programas informáticos
    discurso[n]sucesión de enunciados que comprende más de una frase
    dominio[n]se refiere generalmente a los campos de aplicación de los programas con capacidad lingüística, por ejemplo, banca, seguros, viajes, etc.; su significado en ingeniería lingüística es que el vocabulario de una aplicación queda restringido, delimitándose el ámbito de ésta, para reducir las necesidades de recursos lingüísticos
    ELAO[s]Enseñanza de Lenguas Asistida por Ordenador
    elocución[n]cadena de sonidos producidos por un hablante entre dos pausas
    etiquetar[v]anotar un corpus adjuntando información a las palabras para describir su contexto gramatical y/o las asociaciones con otras palabras
    extracción de información[g]proceso de seleccionar la información de una base de datos por medio de índices basados en palabras claves, la semántica, y/o la búsqueda de concepto
    fonema[n]unidad del habla que permite diferenciar palabras con distinto significado (por ejemplo, paso - vaso)
    formalismo[n]medio de representar las normas que se utilizan en la creación de un modelo de conocimiento lingüístico
    generación de discurso[g] véase Generación de habla
    generación de lenguaje natural[g] véase Generación de lenguaje natural
    generar[v]producir lenguaje en una forma determinada, a partir de otra forma de lenguaje o de información; véase también generación de discurso y generación de lenguaje natural (véase Generación de habla y Generación de lenguaje natural)
    globalización[n]proceso de preparación del soporte lógico para su utilización en cualquier entorno lingüístico y cultural, diseñándolo específicamente para este fin o añadiendo al soporte lógico existente medios para facilitar la localización subsiguiente (véase abajo)
    gramática[n]véase Gramáticas
    habla continua[g]producida cuando el hablante no tiene en cuenta al oyente (por ejemplo, un dispositivo de reconocimiento de habla) y habla sin hacer pausas después de cada palabra
    herramientas de creación[g]medios que se facilitan con el procesador de textos para ayudar al autor de documentos, y que suelen constar de diccionario en línea y correctores ortográficos, gramaticales y de estilo, así como de recursos para estructurar, integrar y enlazar documentos
    herramientas integradas de apoyo a la traducción[g]entorno informático de trabajo para traductores humanos que ofrece una serie de medios de ayuda, como diccionarios, tesauros, memorias de traducción en línea, etc.
    hipertexto[n]sistema que se utiliza comúnmente en los archivos de ayuda y en la World Wide Web, por el que un texto resaltado sirve para enlazar (como si se tratase de un índice) con otro texto relacionado con él (a menudo una explicación más detallada del punto resaltado)
    identificación del locutor[g] véase Identificación y verificación del locutor
    independiente del locutor[g]designa un sistema de reconocimiento capaz de reconocer el habla independientemente del locutor, es decir, que no necesita entrenamiento para reconocer a hablantes específicos
    indizar[v]construir un medio conciso de referencia a la información en una base de datos que, en el caso de la información textual, puede basarse en palabras clave o conceptos
    ingeniería lingüística[g]aplicación de los conocimientos de la lengua al desarrollo de sistemas informáticos para que puedan reconocer, comprender, interpretar y generar lenguaje humano en todas sus formas
    interlengua[n]lenguaje inventado que puede utilizarse como representación formal y común, a la cual puede traducirse la lengua de partida, y a partir de la cual puede la lengua de llegada
    interpretar[v]por lo general, atribuir significado a la lengua; pero también, traducir de una lengua a otra, habitualmente de modo oral, en tiempo real
    léxico[n]véase Léxicos
    lematizar[v]descomponer una palabra en raíz (forma básica) y terminación
    lenguaje controlado (también, lenguaje artificial)[g]lenguaje que se ha diseñado para restringir el número de palabras y la estructura lingüística utilizada, para facilitar el tratamiento de la lengua; los usuarios característicos del lenguaje controlado trabajan en campos donde la precisión y la velocidad de respuesta es fundamental, por ejemplo, policía y servicios de emergencias, pilotos de aviones, control del tráfico aéreo, etc.
    lingüística computacional[g]campo de la lingüística aplicada relacionado con el procesamiento del lenguaje natural por ordenadores
    localizar[v]adaptar el soporte lógico a requisitos locales de carácter lingüístico y cultural (incluidos, por ejemplo, la práctica jurídica y los convenios empresariales)
    marcar[v]anotar el texto para definir su estructura y presentación de tal manera que la estructura pueda ser reproducida por un sistema informático distinto del utilizado para su creación
    memoria de traducción[g]sistema que construye conocimientos sobre la traducción de una lengua a otra memorizando y reutilizando traducciones previas
    modelo oculto de Markov[g]máquina de estado finito en que las transiciones no sólo son de probabilidad sino también de producción; se utiliza actualmente en los sistemas de reconocimiento de habla para determinar las palabras que representan las formas de las ondas sonoras capturadas
    modelos de usuario[g]designa por lo general, en el reconocimiento del habla en un sistema de diálogo, un componente sensible a las diversas clases de usuarios que el sistema pueda encontrar
    morfema[n]menor elemento significativo de la lengua
    morfología[n]ciencia de la estructura de palabras
    multilingüe[adjetivo]se utiliza propiamente para expresar que algo existe en una forma que puede comportar varias lenguas, pero a menudo se emplea para describir la existencia de varias versiones lingüísticas
    nombres propios[g]véase Léxicos especializados
    onomástica[n]investigación científica sobre los nombres propios (véase Léxicos especializados)
    procesamiento del lenguaje natural[g]término en uso desde los años 80 que describe un tipo de sistemas informáticos para el tratamiento inteligente de textos
    prueba del Mago de Oz[g]prueba en que el componente automatizado de la máquina es substituido por cierta forma de intervención humana, pero de manera que el usuario participante en la prueba desconozca el cambio
    reconocimiento óptico de caracteres[g]véase Reconocimiento de caracteres e imágenes
    reconocimiento de caracteres[g]véase Reconocimiento de caracteres e imágenes
    reconocimiento de imágenes[g]véase Reconocimiento de caracteres e imágenes
    reconocimiento del habla[g]véase Reconocimiento de la voz
    recuperación de datos[g]término genérico que se utilizada habitualmente para designar la consulta y suministro de información por métodos diversos en bases de datos de lenguaje natural
    recursos lingüísticos[g]véanse Recursos lingüísticos
    redes de palabras[n]véase Léxicos especializados
    resumen[n]descripción breve, sucinta, de un documento, que abarca todo su contenido
    resumir[v]producir una descripción sucinta de un documento, que abarque todo su contenido
    ROC[s]véase reconocimiento óptico de caracteres
    sílaba[n]unidad de pronunciación mayor que un sonido (véase arriba fonema) y menor que una palabra
    semántica[n]análisis de la lengua para determinar el significado
    sintaxis[n]reglas que describen la formación de las frases a partir de los elementos básicos de la lengua, es decir, los morfemas, palabras y partes de la oración
    terminología[n]véase Léxicos especializados
    tesauro[n]diccionario de sinónimos
    texto[n]se utiliza frecuentemente para distinguir del discurso oral el lenguaje escrito, impreso, o registrado mediante símbolos (codificación de caracteres)
    traducción asistida por ordenador[g]ayuda al traductor humano para traducir de una lengua a otra por medio de herramientas informáticas
    traducción automática[g]proceso de traducir de una lengua a otra por ordenador
    traducir[v]trasladar un texto de una lengua a otra
    verificación del locutor[g]véase Identificación y verificación del locutor
    versión[n]edición de un documento diferente de la edición previa


    | Menú principal | I*M Europe | Telematics | What's new | News | Events | Reports | Indexes | Site map | FAQ | About this site | Búsqueda textual | Feedback y Preguntas |