Some examples of MT

The most popular Machine Translation systems are Systran, OESi and Reverso, but there are more remarkable examples that we should know, some of them are:

  • SMART Translator software: translates Controlled English into several languages, such as Spanish, Brazilian, Italian, Portuguese or French.
  • Automatic Translation Server(ATS) : translates into Spanish, Catalan, Portuguese and English. The limit of the free translation is fifty words.
  • World Magic Translation software:translates English and Spanish for 8 to10 cents per word.
  • Translation Experts (TranEx): it contains NeuroTran-machine translator and dictionary- English,Spanish, French, German, Hungarian, Polish, Croatian, Bosnian and Serbian. Also InteractiveTran- machine translator and dictionary too, with a lot of languages, such as Arabic, Russian, Spanish, Bulgarian, Chinese, Croatian, Czech, Danish, English, German, European Portuguese or Polish.
  • ESTeam Translator: translates into all the oficial European Union languages and Norwegian.

mayo 30, 2007. IST. Deja un comentario.

Machine Translation (MT)

Machine Translation is “a sub-field of computational linguistics that investigates the use of computer software to translate text or speech from one natural language to another. At its basic level, MT performs simple substitution of words in one natural language for words in another”.

The translation process “may be stated as: Decoding the meaning of the source text and re-encoding this meaning in the target language”. Deriving some abstract rules by which a natural language is governed, that is to say, using corpus techniques, “more complex translations may be attempted, allowing for better handling of differences in linguistic tipology, phrase recognition, and translation of idioms, as well as the isolation of anomalies.

mayo 30, 2007. IST. Deja un comentario.

Translation task according to the FEMTI report

The FEMTI report says that “the characteristics of the translation taks refers to the information flow indeed for the output, from the point of view of the agent (human or otherwise) who receives the translation”.

The characteristics of the translation task are:

  1. Assimilation: “the ultimate purpose of the assimilation task (of which translation forms a part) is to monitor a (relatively) large volume of texts produced by people outside the organization, in (usually) several languages”.
  2. Dissemination: “the ultimate purpose of dissemination is to deliver to others a translation of documents produced inside the organization”.
  3. Communication: “the ultimate purpose of the communication task is to support multi-turn dialogues between people who speak different languages. The translation quality must be high enough for painless conversation, despite possible syntactically ill-formed input and idiosyncratic word and format usage”.

mayo 29, 2007. IST. Deja un comentario.

Meetings on Computational Linguistics

These are some of the next International Meetings on Computational Linguistics:

  • May 27-30: The International Conference on Computational Science (in Beijing, China). This year, the slogan is “Advancing Science and Society through computation”. Some researchers and scientists from basic computing disciplines, researchers from various application areas (physics, arts or humanitarian fields) and software developers and vendors will be here all together aimed to ” discuss problems and solutions in the area, to identify new issues and to shape future directions of research, as well as to help industrial users applyvarious advanced computational techniques”.
  • September 10-12: Conference of Natural Language Procesing (in Sevilla, Spain). This will be the XXIII edition of the Anual Congress of the Spanish Society for Natural Language Procesing (NLP). The researchers of this area will talk about the real posibilities of application of NLP.

mayo 29, 2007. IST. Deja un comentario.

Why study Human Language Technologies?

The Department of Computer Science of the University of Sheffield give  some reasons to study Human Language Technologies (HLT): “Systems which use HLT are now in everyday use, through technologies such as internet search engines and mobile phones, and most major international computer and telecoms companies now engage in HLT research and developement. As a result, there is a strong demand for graduates with the highly-specialised multidisciplinary skills that are required in HLT, both as practitioners in the development of HLT applications and as reserchers into the advanced capabilities required for next-generation HLT systems”.

mayo 29, 2007. IST. Deja un comentario.

Some definitions of Human Language Technologies

  • “Language technology — sometimes also referred to as human language technology — comprises computational methods, computer programs and electronic devices that are specialized for analyzing, producing or modifying texts and speech. These systems must be based on some knowledge of human language. Therefore language technology defines the engineering branch of computational linguistics”. German Research Center for Artificial Intelligence, Hans Uszkoreit (http://www.dfki.de/lt/lt-general.php) (2007).
  • “The overall objective of HLT is to support e-business in a global context and to promote a human centred infostructure ensuring equal access and usage opportunities for all. This is to be achieved by developing multilingual technologies and demostrating exemplary applications providing features and functions that are critical for the realisation of a truly user friendly Information Society. Projects address generic and applied RTD from a multi- and cross-lingual perspective, and undertake to demostrate how language specific solutions can be transferred to and adapted for other languages”. IST web , KA3, Human Language Technologies (2004, November 13).

mayo 29, 2007. IST. Deja un comentario.

European research centres for Human Language Technologies

Some research centres for HLT are:

abril 17, 2007. IST. 1 Comentario.

Educar con películas pornográficas

El gobierno de Vietnam planea ofrecer descargas de películas porno para enseñar a las parejas casadas cómo mantener relaciones sexuales saludables.

Esta noticia puede resultar sorprendente, sobre todo teniendo en cuenta que allí someten a un estricto control las páginas porno. El gobierno vietnamita obliga a los cibercafés a instalar equipos que vigilan a los internautas y bloquean los sitios pornográficos.

El subdirector del Instituto para el Desarrollo Social vietnamita, Khuat Thu Hong, ha explicado que pretenden luchar contra el divorcio y la prostitución.

Al parecer, hay muchos casos de parejas que pasan más de un año sin follar. Uy, no, sin hacer el amor. Hong piensa que con una mejor educación sexual esto cambiaría.

Mientras el gobierno de Vietnam intenta hacer creer que su idea no es conservadora ( a pesar de que no sabemos a qué se refieren con “saludable” y de que sólo serán los casados los que se beneficiarán de la “educación sexual”) Amnistía Internacional recoge firmas contra la censura en Internet en países como el mismísimo Vietnam (ohhhh, no nos lo esperábamos), China, Irán o Siria. Y es que la vigilancia en la red no se limita al sexo. La libertad y otras cosas igual de peligrosas también tienen que ser restringidas. Por nuestro bien, claro.

febrero 11, 2007. IST, Uncategorized. Deja un comentario.

17 de noviembre de 2006

Ésta fue la fecha de nuestra primera conferencia. El tema era la relación entre las nuevas tecnologías y las Humanidades. Además, nos presentaron el portal digital Andrés de Poza. La profesora Carmen Isasi moderó el debate en el que participaron tres expertos: Domenico Fiormonte, Peter Shillingsburg y Jose Manuel Lucía.

En España el 35% de la población maneja internet habitualmente. Los internautas han creado un universo enorme gracias al intercambio de información. El medio digital es atrayente porque está abierto a la comunicación. No es extraño que los filólogos encuentren trabajo en un mundo con tantas cosas por decir (al menos, eso nos contaron en la conferencia).

También nos recordaron que está en nuestras manos distinguir la basura o información falsa que pueda llegar hasta nosotros de la que tiene un valor verdadero. En definitiva, el trabajo de investigación no desaparecerá, simplemente tendremos un nuevo soporte para ayudarnos.

Como ejemplo, el portal Andrés de Poza, un  sitio web para la edición digital. Seguid el enlace si queréis presumir porque el proyecto de esta página web nació en ésta, nuestra  universidad .

Como podéis comprobar, fue bastante útil ir a la conferencia. Al menos, a la salida ya podíamos responder a la pregunta tan bien planteada en las diapositivas de la charla: Humanidades digitales, ¿pero qué es eso?. Los momentos divertidos tampoco faltaron. En nuestra mente aún brilla con especial resplandor la visita de La Mosca Erudita.
la-alegre-erudita.jpg

febrero 11, 2007. IST, Littera. Deja un comentario.

Tercer debate del grupo B

Un dato es “una representación simbólica (numérica, alfabética, etc.), de un atributo o característica de una entidad”. El dato no tiene valor semántico (sentido) en sí mismo, pero convenientemente tratado (procesado) se puede utilizar( www.wikipedia.org, 16/01/2007 )

 

En el campo de los ordenadores el contenido es todo aquello que forma un sitio web, como fotografías, videos, música y texto en sus distintas formas. El contenido también se puede entender como lo que hay dentro de los datos, es decir, la información interna a un dato( http://www.w3.org/TR/WAI-WEBCONTENT/#content-structure, 05/06/1999).

 

Los metadatos son “datos que describen otros datos” El concepto de metadatos es análogo al uso de índices para localizar objetos en vez de datos.( www.wikipedia.org, 16/01/2007 )

 

“Un metacontenido no es más que la información relativa al contenido del documento, como su título, autor, tamaño del archivo, fecha de creación, historial de cambios, etc”   ( http://www.programacion.net/tutorial/joa_xml/1/ , 16/01/2007 )

 

“Un metalenguaje es una gramática formal destinada a la descripción de un lenguaje”    ( http://html.rincondelvago.com/lenguajes-de-programacion_12.html, 16/01/2007), existen varios metalenguajes entre los cuales podemos encontrar algunos más antiguos como BNF (Backus-Naur-Form) o CBL (COBOL-Like), y también los hay más actuales y dinámicos como DTD y posteriormente XML el cual sigue desarrollándose (http://www.desarrolloweb.com/articulos/478.php, 16/01/2007).

 

“Los metadatos, utilizados tradicionalmente en el entorno bibliotecario, están resultando de gran utilidad en la Web, tanto en Sistemas de Recuperación de Información (back-end) como en Sistemas de Navegación (front-end).

Son una herramienta básica en la organización, clasificación y descripción de información, tareas propias de la Arquitectura de la Información.” (Artículo de Yusef Hassan Montero, Francisco J. Martín Fernández, Óscar Martín Rodríguez -Centro de  Enseñanzas Virtuales de la Universidad de Granada-, 28/02/2003)

enero 21, 2007. IST. Deja un comentario.

Página siguiente »

Seguir

Get every new post delivered to your Inbox.