Illustration par DALL-E (+PJ)
Large language models are having their Stable Diffusion moment, par Simon Willison, mis en ligne le 11 mars 2023.
Des dizaines de modèles linguistiques ouverts ont été publiés au cours des dernières années, mais aucun d’entre eux n’a réussi à me satisfaire sur les points suivants :
- Facilité d’exécution sur mon propre matériel
- Suffisamment grand pour être utile – idéalement équivalent en termes de capacités au GPT-3
- Suffisamment ouvert pour pouvoir être modifié.
Tout cela a changé hier, grâce à la combinaison du modèle LLaMA de Facebook et de llama.cpp de Georgi Gerganov.
[…] Ils sont donc dans la nature maintenant. Vous ne pourrez peut-être pas légalement créer un produit commercial à partir d’eux, mais le génie est sorti de la bouteille. Ce bruit de frappe furieuse que vous pouvez entendre est celui de milliers de hackers de par le monde qui commencent à creuser et à découvrir ce qu’est la vie quand on peut faire tourner un modèle de classe GPT-3 sur son propre matériel.
Laisser un commentaire