Esta noticia es muy importante para el mundo de Generación de Contenidos, ya que ChatGPT es uno de los modelos de lenguaje más avanzados del mundo. Y ahora, con el lanzamiento de Dolly, otros pueden crear y desarrollar sus propios modelos de lenguaje de código abierto.
Esto significa que el Tecnología de IA es cada vez más accesible y democrática. Ahora, más personas pueden contribuir a la evolución de la IA y desarrollar soluciones que cumplan necesidades de la sociedad.
La creación de un modelo de lenguaje de código abierto también significa que más personas pueden usarlo para desarrollar chatbots, asistentes virtuales y otros soluciones de IA para sus empresas o proyectos personales.
O Lanzamiento de Dolly es un testimonio del potencial de la tecnología de código abierto para cambiar la forma en que se crea y utiliza la IA. Con más empresas y desarrolladores trabajando juntos, podemos esperar avances aún más significativos en los próximos años.
Colaboración y transparencia impulsadas por modelos de lenguaje de código abierto
Un ejemplo reciente de esta tendencia es el Dolly LLM, un modelo de lenguaje de código abierto a gran escala que busca proporcionar un acceso más amplio a Tecnología de IA. Con esta iniciativa el objetivo es evitar que las empresas tengan miedo de compartir datos confidenciales con terceros que controlan la tecnología de IA.
Una de las principales razones que impulsan el movimiento de IA de código abierto es el temor de que las empresas se muestren reacias a compartir información sensible con un tercero que controla la tecnología. Esto podría perjudicar la innovación y la evolución del sector.
Con la creciente popularidad de los modelos de lenguaje de código abierto a gran escala, es posible una mayor transparencia. colaboración e intercambio de información. Esto puede contribuir al desarrollo de la IA de una manera más rápida, eficiente y segura.
La iniciativa para hacer que la IA sea de código abierto puede tener un Gran impacto en la sociedad y la economía., promoviendo una mayor democratización de la tecnología y fomentando la innovación en todo el mundo. Es un paso importante para hacer que la IA sea más accesible y permitir que más personas contribuyan a la evolución de la tecnología.
Dolly: la nueva creación de código abierto basada en modelos de lenguaje
La base del éxito de Dolly es LLaMA, un modelo de lenguaje de código abierto con 65 mil millones de parámetros creado por Meta. LLaMA se capacita en datos disponibles públicamente, lo que permite una mejora constante. Según un artículo de Weights & Biases, Llama puede superar a muchos modelos de lenguaje importantes a pesar de ser más pequeño.
Con el uso de LLaMA y la creación de Dolly, el inteligencia artificial en chatGPT puede alcanzar un nuevo nivel. Estas tecnologías permiten una comunicación más efectiva y natural con los usuarios, además de permitir que el modelo evolucione constantemente y se adapte a nuevos desafíos. La creación de modelos de lenguaje de código abierto entrenados con datos públicos es una tendencia importante en inteligencia artificial, y Dolly es un excelente ejemplo de los resultados positivos que este enfoque puede generar.
La importancia de entrenar la calidad de los datos para mejorar el procesamiento del lenguaje natural
Este artículo explica que al utilizar instrucciones escritas por expertos para nuevas tareas, el Modelo de lenguaje GPT-3 se pueden ajustar de manera más eficiente que cuando se utilizan conjuntos de datos públicos existentes.
Realizaron evaluaciones en humanos y descubrieron que el método SELF-INSTRUCT superó a otros métodos, dejando solo una diferencia del 5% en comparación con el mejor método existente.
Ahora, un nuevo herramienta llamada Dolly demuestra que es posible crear un modelo de lenguaje grande y útil con un conjunto de datos más pequeño pero de alta calidad. Funciona modificando un modelo EleutherAI de código abierto de 6 mil millones de parámetros, agregando instrucciones que siguen características como generación de texto y lluvia de ideas, que no estaban presentes en el modelo original. Esto fue posible gracias al uso de datos de Alpaca.
Lo más sorprendente es que no es necesario tener el último ni el mejor modelo para obtener instrucción siguiendo habilidades, ya que el modelo utilizado tiene sólo 6 mil millones de parámetros, frente a los 175 mil millones del GPT-3.
Este descubrimiento es alentador para quienes trabajan con procesamiento natural del lenguaje, ya que sugiere que la calidad del conjunto de datos es más importante que el tamaño. Y esto abre la puerta a modelos de lenguaje más pequeños pero de mayor calidad, que pueden conducir a una mejora significativa en la calidad del procesamiento del lenguaje natural.
Conclusión
Además, iniciativas como mozilla.ai demuestran un movimiento creciente hacia el uso de software de código abierto para hacer que la IA sea más accesible y transparente. Con estas iniciativas creemos que la inteligencia artificial estará cada vez más presente en nuestras vidas, aportando importantes beneficios a la sociedad.