Sociedad: Esto va rápido: chat gpt4 o3

Que IA estas ejecutando?
Puedes entrenarla tu definiendo ficheros como fuentes de datos?

Hay diferentes técnicas para eso, lo ideal es el llamado "fine-tuning" que modifica la estructura del modelo pero requiere bastante trabajo de proceso, hasta hace no mucho era casi imposible hacerlo localmente y había que recurrir a alquilar tarjetas NVidia profesionales pero han aparecido técnicas nuevas (ej LoRA) que han simplificado mucho el proceso y creo que ahora sí se puede hacer localmente con una tarjeta de rango medio-alto, aunque esto es algo que nunca he hecho aún pero tengo en mi lista de tareas pendientes.

Luego está el llamado RAG que utiliza una base de datos (y modelo) paralelos al LLM y tiene como ventaja que es mucho más rápido y fácil de crear pero a cambio pierde eficiencia.

Yo le preguntaría a una IA grande tipo ChatGPT que te explique, los interfaces de IAs locales más avanzados hace tiempo que incluyen RAG de serie por lo que puedes subir tus propios documentos y preguntar a la IA sobre ellos, a mí personalmente no me ha funcionado demasiado bien pero hace tiempo que no estoy en ese tema.

Proyectos recomendados: LM Studio, jan.ai como aplicaciones locales soportan RAG aunque es una característica en beta en ambos, y en el navegador son bastante populares oobabooga y también openwebui
 
Última edición:
Solo los usuarios registrados pueden ver el contenido de este tema, mientras tanto puedes ver el primer y el último mensaje de cada página.

Regístrate gratuitamente aquí para poder ver los mensajes y participar en el foro. No utilizaremos tu email para fines comerciales.

Únete al mayor foro de economía de España

 
Solo los usuarios registrados pueden ver el contenido de este tema, mientras tanto puedes ver el primer y el último mensaje de cada página.

Regístrate gratuitamente aquí para poder ver los mensajes y participar en el foro. No utilizaremos tu email para fines comerciales.

Únete al mayor foro de economía de España

 
Solo los usuarios registrados pueden ver el contenido de este tema, mientras tanto puedes ver el primer y el último mensaje de cada página.

Regístrate gratuitamente aquí para poder ver los mensajes y participar en el foro. No utilizaremos tu email para fines comerciales.

Únete al mayor foro de economía de España

 
Solo los usuarios registrados pueden ver el contenido de este tema, mientras tanto puedes ver el primer y el último mensaje de cada página.

Regístrate gratuitamente aquí para poder ver los mensajes y participar en el foro. No utilizaremos tu email para fines comerciales.

Únete al mayor foro de economía de España

 
Solo los usuarios registrados pueden ver el contenido de este tema, mientras tanto puedes ver el primer y el último mensaje de cada página.

Regístrate gratuitamente aquí para poder ver los mensajes y participar en el foro. No utilizaremos tu email para fines comerciales.

Únete al mayor foro de economía de España

 
Solo los usuarios registrados pueden ver el contenido de este tema, mientras tanto puedes ver el primer y el último mensaje de cada página.

Regístrate gratuitamente aquí para poder ver los mensajes y participar en el foro. No utilizaremos tu email para fines comerciales.

Únete al mayor foro de economía de España

 
Hay diferentes técnicas para eso, lo ideal es el llamado "fine-tuning" que modifica la estructura del modelo pero requiere bastante trabajo de proceso, hasta hace no mucho era casi imposible hacerlo localmente y había que recurrir a alquilar tarjetas NVidia profesionales pero han aparecido técnicas nuevas (ej LoRA) que han simplificado mucho el proceso y creo que ahora sí se puede hacer localmente con una tarjeta de rango medio-alto, aunque esto es algo que nunca he hecho aún pero tengo en mi lista de tareas pendientes.

Luego está el llamado RAG que utiliza una base de datos (y modelo) paralelos al LLM y tiene como ventaja que es mucho más rápido y fácil de crear pero a cambio pierde eficiencia.

Yo le preguntaría a una IA grande tipo ChatGPT que te explique, los interfaces de IAs locales más avanzados hace tiempo que incluyen RAG de serie por lo que puedes subir tus propios documentos y preguntar a la IA sobre ellos, a mí personalmente no me ha funcionado demasiado bien pero hace tiempo que no estoy en ese tema.

Proyectos recomendados: LM Studio, jan.ai como aplicaciones locales soportan RAG aunque es una característica en beta en ambos, y en el navegador son bastante populares oobabooga y también openwebui
Gracias Romualdo
Yo la verdad es que solo he probado en local Whisper (tras*forma audio en texto) y sin una buena gráfica los tiempos son a veces desesperantes. Cuando he necesitado mayor velocidad he tirado de google colab.

La idea que llevo en mente es darle una información concreta a un modelo de lenguaje. Lo que me gustaría (y de ahí que hiciese la pregunta) es que contestase unicamente en base al entrenamiento / fine tuning que yo le he dado como imput (por ejemplo, una colección de pdfs) y no con programación o reglas que ya vienen de serie.

Investigaré el tema porque lo tengo pendiente también, pero con las limitaciones de mi hardware creo que sera complicado.

Seguiré tus consejos

Gracias de nuevo, aprecio que te hayas tomado un rato en contestar :)
 
Volver