domingo, 18 de mayo de 2014

Hacia la biblioteca digital semántica

Amigos, os voy a hablar de un libro que me resultó muy interesante, se titula Hacia la biblioteca digital semántica, del autor José Manuel Morales del Castillo.

Morales del Castillo afirma que las bibliotecas digitales son ya hoy en día uno de los principales modos de acceso a la información en la Web, y este papel se va a ver reforzado en el nuevo marco de la enseñanza superior europea como elemento dinamizador de la investigación y la docencia. No obstante, como grandes repositorios de información en continuo crecimiento, es necesario dotar a las bibliotecas digitales de mecanismos que sean capaces de ofrecer la información que requieren los usuarios de la manera más eficiente posible y satisfacer así sus necesidades de información.
Morales del Castillo, analiza cómo la aplicación a las bibliotecas digitales de nuevas tecnologías de la información (como las tecnologías de web semántica) pueden mejorar sensiblemente el servicio que se presta a los usuarios.
La Web semántica se está afianzando poco a poco como el modelo al que evolucionará la Web actual y que abrirá el camino al desarrollo de las bibliotecas digitales semánticas.
La Web actual muestra síntomas de agotamiento debido a la enorme cantidad de información que no para de crecer. Esto hace cada vez más difícil poder gestionarla de manera eficaz.
Morales del Castillo cita como ejemplo una simple consulta en un buscador. Cuando introducimos una serie de palabras clave, su motor de búsqueda aplica a estas un algoritmo que, mediante técnicas estadísticas de análisis léxico, nos devuelve un listado de documentos ordenados por relevancia. Como bien sabemos, este listado de resultados no satisface del todo la necesidad de información. Esto sucede porque el motor es incapaz de “comprender” qué pretendía buscar exactamente el usuario.
Dicho de otra manera, las máquinas son capaces de realizar análisis léxico de los documentos, pero obvian un análisis más profundo, como el semántico o el pragmático, que son los que realmente capturan el sentido del contenido.
Podríamos afirmar, por lo tanto, que para el motor de búsqueda, es lo mismo un documento sobre los bancos de atunes que una noticia sobre el Banco Mundial ¿no?

Según el autor, la web semántica es el futuro de la web, una web que facilitará la localización de recursos, la comunicación entre sistemas y programas y que nos ayudará a gestionar nuestro día a día, hasta llegar a niveles que hoy pueden ser considerados como de ciencia ficción. Por ejemplo, la web semántica nos permitirá hacer búsquedas precisas del tipo quiero el viaje más barato que hay entre Madrid y Barcelona, teniendo en cuenta que me gusta ir en ventanilla y en no fumadores.

La red semántica no es una red independiente de la actual, sino una ampliación; una red en la cual la información está dotada de significados bien definidos, con el fin de que la coordinación del trabajo entre humanos y ordenadores sea más completa.

Morales del Castillo establece que el modelo de web semántica está formado por seis capas diferentes: en las tres primeras, se establecen las bases para poder representar la información de una manera semánticamente accesible, mientras que en las tres superiores se definen los elementos que permiten a los agentes software autentificar y comprobar la confiabilidad de los diferentes elementos del modelo.

Para terminar, debo hablaros de la viabilidad del proyecto Web semántica. A pesar de estar aceptado el modelo teórico de esta web, no han dejado de surgir voces críticas poniendo en entredicho su viabilidad. Algunos autores se aproximan a la web como una aplicación de la Inteligencia Artificial al ámbito de la web, y advierten sobre las inconsciencias semánticas que se pueden derivar de la definición de algunos elementos del modelo o de la dificultad de extraer semántica de los documentos expresados en lenguaje natural.
No obstante, hoy en día, en la realización del proceso de esta web tienen más peso las propuestas que se hacen desde los movimientos de software libre que promueven las Web 2.0 que las que puedan provenir del campo de la inteligencia artificial.

Recomiendo que lo leáis ;)

Sonidos y percepciones en publicidad



Un tema que siempre me ha inquietado es el de la lengua dentro del mundo publicitario. En publicidad no solo las imágenes y los colores son importantes, también son importante los sonidos y percepciones. Aquí es donde nuestros expertos publicitarios juegan con nuestra lengua. Los sonidos no son percibidos del mismo modo por todos los consumidores. Por ello, según los lingüistas, podemos diferenciar dos tipos de rimas: la masculina y la femenina.
Las palabras que tienen rima masculina son las que se acentúan en la última sílaba, en otras palabras, son las llamadas palabras agudas. Por ejemplo, las marcas MISTOL o DIXAN, tienen rima masculina. Por tanto, también tienen esta rima, las palabras monosílabas, como por ejemplo, las marcas DASH o BOLD. ¿Qué consiguen nuestros publicistas con esta rima? Esta se emplea para transmitir imagen de fuerza, efectividad, agresividad y rendimiento.
Las palabras que tienen rima femenina son las que se acentúan en la penúltima sílaba, es decir, las palabras llanas. ¿Qué efecto se consigue con estas palabras? Estas se emplean para expresar suavidad, cuidado y protección, por eso, la mayoría de las marcas de productos de higiene personal, como por ejemplo champús, productos de higiene íntima, etc., tienen esta rima femenina. Algunos ejemplos de rima femenina son: TAMPAX, TIMOTEI y SANEX.
Todos los nombres de productos están enfocados para la venta. Antes de decidir un nombre para una marca concreta, se busca cómo puede inducir su denominación a la compra y, evidentemente, si el producto es una compresa, deberá tener rima femenina porque lo que se pretende es que cuando una mujer oiga el nombre de la marca del producto, sienta que lo que va a comprar es suave, delicado y que le va proporcionar protección. 
Todo esto es gracias a nuestras palabras agudas y llanas. ¿Podría ser más impresionante?

Koenización

Después del debate de la última clase de Español en los medios de comunicación, me viene una pregunta a la cabeza:

¿Por qué el habla de Argentina es tan distinta al habla de Lima o de México y por qué es el andaluz el que se impone?

Voy a intentar responderla:


Surge en la última década del siglo XX la llamada teoría de la Koenización y estandarización. Se basan en un famoso artículo de Siegel, que estudia una serie de islas del Índico donde había ingleses y se crearon una especie de interlenguas que daban lugar a fenómenos universales, pues se juntaron individuos de distintas lenguas y dialectos. La koiné aparece mediante dos procesos: la simplificación y la reducción. 
Tenemos una situación donde individuos de una procedencia tienen que vivir en un mismo territorio. Con el tiempo, esa koiné tiene hablantes nativos y lo que hacen los estudiosos es aplicar la teoría de Siegel en el caso americano. La confluencia de distintos hablantes (los hablantes que lleguen serán de muchos rincones de España), se puede observar en los documentos donde se puede percibir cierto eco de la confluencia de dialectos. En el caso del léxico se percibe claramente, con voces dialectales en América que en España se hacen generales. Aunque también encontramos restos en la pronunciación. Pero llegan individuos que hablan diferente en un mismo territorio y todos tienen que convivir y hablar y la manera de hablar es crear una koiné. Es un proceso inconsciente, natural, llamado acomodación; de manera espontánea todos empiezan a acomodarse y, primero se tiende a encontrar cosas comunes; con los rasgos diferentes, se aplica el proceso de reducción y simplificación. La reducción es una simplificación cuantitativa. Cuando hay distintas variantes de lo mismo, se elige una espontáneamente. La reducción la vemos en la fonética. La simplificación, por su parte, es cualitativa y la vemos en la fonología. Dadas las diferencias, va a predominar en la koiné lo más simple. Además, tampoco impide que de todos los dialectos que entran en contacto, se eliminen. Es más, algunos lingüistas como Penny, dicen que el andaluz ya era una koiné, por contacto entre los castellanos y los leoneses. Por lo tanto, esa primera koiné que se extiende en Las Antillas tomó un tinte andaluzado que se extiende por otros lados, es una lengua de grupo. La koiné se convierte en lo que llaman los lingüistas lenguas intergrupales, un interdialecto, algo siempre de manera espontánea. Los procesos de acomodación dan lugar al interdialecto, que sería la tercera fase. Entonces aparece la nativización, donde aparecen las primeras características del español en América, esta es la cuarta fase. Los hijos conocerán la variedad de sus padres, pero hablarán ese interdialecto que nativizarán. Surgen hablantes nativos andaluzados por toda América y a partir de aquí, viene el último proceso, la estandarización, que hace que un argentino hable distinto de un mexicano. La estandarización consiste en que la manera de hablar de uno, tenga prestigio, convirtiendo una manera regional de hablar para estandarizarla y según como fuera la estandarización, así tenemos distintos casos en América.
Fontanella habla, en primer lugar, de una escala, donde tenemos menos estandarización y máxima estandarización y, a mayor estandarización, menores rasgos marcados, hipercaracterísticos y, a partir de ahí, Fontanella señala tres casos de estandarización: México, de máxima estandarización, Paraguay, que sería la mínima estandarización y Buenos Aires, de media estandarización. México tiene una estandarización unida a la ciudad, caso típico de estandarización temprana máxima, lo que hace que incorpore decididamente rasgos septentrionales, cuando era andaluzada. Estandarizar quiere decir que disminuye al máximo los rasgos meridionales para añadir rasgos septentrionales. Por su parte, Paraguay, es una zona lateral, lejos de las cortes virreinales y de la costa, con una única variedad española, es la variedad americana más variada, porque tiene muchas características que lo alejan del estándar, donde vamos a encontrar muchos meridionalismos. Buenos Aires tiene una estandarización de rasgos característicos del español bonaerense, pero se produce la independencia de Argentina, desaparece el virreinato y se conservan hipercaracterísticas, por ejemplo, la variante ensordecida del rehilamiento, ya que su estandarización fue intermedia.