Noticias y Consejos

Dolly: el nuevo clon de código abierto de ChatGPT que está revolucionando la Inteligencia Artificial

La empresa de software empresarial Databricks ha lanzado el nuevo modelo de lenguaje llamada Dolly, una versión de código abierto de ChatGPT. El nombre Dolly es un homenaje a la famosa oveja del mismo nombre, el primer mamífero clonado.

Esta noticia es muy importante para el mundo de Generación de Contenidos, ya que ChatGPT es uno de los modelos de lenguaje más avanzados del mundo. Y ahora, con el lanzamiento de Dolly, otros pueden crear y desarrollar sus propios modelos de lenguaje de código abierto.

Esto significa que el Tecnología de IA es cada vez más accesible y democrática. Ahora, más personas pueden contribuir a la evolución de la IA y desarrollar soluciones que cumplan necesidades de la sociedad.

La creación de un modelo de lenguaje de código abierto también significa que más personas pueden usarlo para desarrollar chatbots, asistentes virtuales y otros soluciones de IA para sus empresas o proyectos personales.

O Lanzamiento de Dolly es un testimonio del potencial de la tecnología de código abierto para cambiar la forma en que se crea y utiliza la IA. Con más empresas y desarrolladores trabajando juntos, podemos esperar avances aún más significativos en los próximos años.

Colaboración y transparencia impulsadas por modelos de lenguaje de código abierto

Los modelos de lenguajes de código abierto a gran escala están cada vez más presentes en el mundo. universo de la Inteligencia Artificial (IA), con el objetivo de brindar un acceso más amplio a la tecnología, para que no sea monopolizada y controlada por las grandes corporaciones.

Un ejemplo reciente de esta tendencia es el Dolly LLM, un modelo de lenguaje de código abierto a gran escala que busca proporcionar un acceso más amplio a Tecnología de IA. Con esta iniciativa el objetivo es evitar que las empresas tengan miedo de compartir datos confidenciales con terceros que controlan la tecnología de IA.

Una de las principales razones que impulsan el movimiento de IA de código abierto es el temor de que las empresas se muestren reacias a compartir información sensible con un tercero que controla la tecnología. Esto podría perjudicar la innovación y la evolución del sector.

Con la creciente popularidad de los modelos de lenguaje de código abierto a gran escala, es posible una mayor transparencia. colaboración e intercambio de información. Esto puede contribuir al desarrollo de la IA de una manera más rápida, eficiente y segura.

La iniciativa para hacer que la IA sea de código abierto puede tener un Gran impacto en la sociedad y la economía., promoviendo una mayor democratización de la tecnología y fomentando la innovación en todo el mundo. Es un paso importante para hacer que la IA sea más accesible y permitir que más personas contribuyan a la evolución de la tecnología.

Dolly: la nueva creación de código abierto basada en modelos de lenguaje

La creación de Dolly es una contribución significativa a la evolución de los modelos de lenguaje en inteligencia artificial. Desarrollado a partir del modelo de código abierto creado por el instituto de investigación EleutherAI y el modelo Alpaca de la Universidad de Stanford, el Muñequita destaca por ser capaz de superar a muchos de los modelos de lenguaje más avanzados, como OpenAI GPT-3, Deep Mind's Gopher y DeepMind's Chinchilla.

La base del éxito de Dolly es LLaMA, un modelo de lenguaje de código abierto con 65 mil millones de parámetros creado por Meta. LLaMA se capacita en datos disponibles públicamente, lo que permite una mejora constante. Según un artículo de Weights & Biases, Llama puede superar a muchos modelos de lenguaje importantes a pesar de ser más pequeño.

Con el uso de LLaMA y la creación de Dolly, el inteligencia artificial en chatGPT puede alcanzar un nuevo nivel. Estas tecnologías permiten una comunicación más efectiva y natural con los usuarios, además de permitir que el modelo evolucione constantemente y se adapte a nuevos desafíos. La creación de modelos de lenguaje de código abierto entrenados con datos públicos es una tendencia importante en inteligencia artificial, y Dolly es un excelente ejemplo de los resultados positivos que este enfoque puede generar.

La importancia de entrenar la calidad de los datos para mejorar el procesamiento del lenguaje natural

La importancia de la creando conjuntos de datos de alta calidad es indiscutible. Y recientemente, un artículo de investigación académica titulado "AUTOINSTRUCCIÓN: Alineación del modelo de lenguaje con instrucciones autogeneradas PDF" destacó la forma de crear entrenamiento de preguntas y respuestas datos generados automáticamente de alta calidad, que son mejores que los datos públicos limitados.

Este artículo explica que al utilizar instrucciones escritas por expertos para nuevas tareas, el Modelo de lenguaje GPT-3 se pueden ajustar de manera más eficiente que cuando se utilizan conjuntos de datos públicos existentes.

Realizaron evaluaciones en humanos y descubrieron que el método SELF-INSTRUCT superó a otros métodos, dejando solo una diferencia del 5% en comparación con el mejor método existente.

Ahora, un nuevo herramienta llamada Dolly demuestra que es posible crear un modelo de lenguaje grande y útil con un conjunto de datos más pequeño pero de alta calidad. Funciona modificando un modelo EleutherAI de código abierto de 6 mil millones de parámetros, agregando instrucciones que siguen características como generación de texto y lluvia de ideas, que no estaban presentes en el modelo original. Esto fue posible gracias al uso de datos de Alpaca.

Lo más sorprendente es que no es necesario tener el último ni el mejor modelo para obtener instrucción siguiendo habilidades, ya que el modelo utilizado tiene sólo 6 mil millones de parámetros, frente a los 175 mil millones del GPT-3.

Este descubrimiento es alentador para quienes trabajan con procesamiento natural del lenguaje, ya que sugiere que la calidad del conjunto de datos es más importante que el tamaño. Y esto abre la puerta a modelos de lenguaje más pequeños pero de mayor calidad, que pueden conducir a una mejora significativa en la calidad del procesamiento del lenguaje natural.

Conclusión

En resumen, la herramienta Dolly representa un gran avance en la democratización de la inteligencia artificial. Gracias a este nuevo enfoque para crear modelos de lenguaje con conjuntos de datos más pequeños pero de alta calidad, más personas pueden tener acceso a esta poderosa tecnología.

Además, iniciativas como mozilla.ai demuestran un movimiento creciente hacia el uso de software de código abierto para hacer que la IA sea más accesible y transparente. Con estas iniciativas creemos que la inteligencia artificial estará cada vez más presente en nuestras vidas, aportando importantes beneficios a la sociedad.

Generación de Contenidos