Dopo OpenAI, POC su Mistral AI il concorrente francese!
Introduzione
Questo articolo esplora uno script Python sviluppato come Proof of Concept (POC) per interagire con Mistral AI, un’alternativa francese a OpenAI. Riprende il principio dello script sviluppato precedentemente per interagire con OpenAI.
Collaborazione con GPT-4 per lo sviluppo dello script
Questo progetto è stato una “collaborazione” con ChatGPT-4, l’ultima versione dell’IA conversazionale di OpenAI. Insieme, abbiamo concepito lo script Python, approfittando della capacità di GPT-4 di comprendere e generare codice. Questa sinergia tra l’expertise umana e l’intelligenza artificiale apre la strada a nuovi metodi di sviluppo e innovazione.
Obiettivi dello Script
L’intenzione principale era di sperimentare con l’API Mistral AI in Python per sviluppare le mie competenze sull’argomento.
- Testare Mistral AI: Esplorare le funzionalità di Mistral AI e capire come utilizzarlo efficacemente.
- Automazione con Python: Mostrare come Python può essere utilizzato per automatizzare le interazioni con le API di IA.
- Arricchimento dei Prompt: Sperimentare con l’arricchimento dei prompt integrando contenuti web recuperati tramite Selenium.
Potenziale dello Script
Questo script apre la strada a diverse applicazioni, tra cui:
- Generazione di contenuti arricchiti: Arricchire dinamicamente i prompt con informazioni rilevanti provenienti dal web.
- Assistenza virtuale personalizzata: Utilizzare l’IA per creare risposte personalizzate basate sui contenuti web.
- Miglioramento degli strumenti di automazione: Integrare l’IA negli strumenti esistenti per una migliore performance.
Funzionamento dello Script
Lo script mistral-ai.py
utilizza il modello mistral-small
per generare risposte. Ecco il suo funzionamento:
- Recupero del Contenuto Web: Utilizza Selenium per estrarre il contenuto delle URL specificate nel prompt.
- Generazione delle Risposte: Invia il prompt arricchito a Mistral AI per ottenere una risposta.
Osservazioni Importanti
- Questo script è un POC: È destinato a fini educativi e di sperimentazione, e non per un utilizzo in produzione.
- Rispetta sempre le regole di utilizzo delle API e dei siti web: Quando usi l’API MistralAI e fai scraping dei siti web, assicurati di rispettare i termini di utilizzo e le politiche sulla privacy.
Ecco la sezione completa con l’aggiornamento del codice e l’esempio di utilizzo, integrata come nel post originale del blog:
Aggiornamento del 28 settembre 2024: Script corretto per Mistral AI
Dalla pubblicazione iniziale in gennaio 2024, ci sono state importanti evoluzioni, in particolare con le ultime versioni dell’API Mistral e delle librerie utilizzate (Selenium e ChromeDriver). Lo script precedente è ora obsoleto ed è stato aggiornato per assicurare la compatibilità con queste nuove versioni. Il nuovo script utilizza il modello mistral-large-latest
e apporta una gestione automatizzata di ChromeDriver tramite webdriver_manager
.
Nuovo Codice dello Script mistral-ai.py
#!/usr/bin/env python3
import re
import sys
import os
from selenium import webdriver
from selenium.webdriver.chrome.service import Service
from selenium.webdriver.chrome.options import Options
from webdriver_manager.chrome import ChromeDriverManager
from mistralai import Mistral
def get_web_content(url):
if not url:
return ""
try:
# Configure Chrome options
chrome_options = Options()
# Use ChromeDriverManager to automatically manage the ChromeDriver installation
driver = webdriver.Chrome(
service=Service(ChromeDriverManager().install()), options=chrome_options
)
# Make a request to the web page
driver.get(url)
# Retrieve the JavaScript content of the page
web_content = driver.execute_script("return document.documentElement.innerText")
# Close the browser when you're done
driver.quit()
return web_content if web_content else None
except Exception as e:
return None
def get_response(question, client):
urls = re.findall(r"(https?://\S+)", question)
if urls: # Vérifiez si une URL a été fournie
for url in urls:
web_content = get_web_content(url)
if web_content:
# Remplacez l'URL par le contenu du web dans le prompt
question = question.replace(url, web_content)
else:
print(f"Erreur: Le contenu web pour {url} ne peut être récupéré.")
sys.exit(1) # Exit the script with an error code
messages = [{"role": "user", "content": question}]
response = client.chat.complete(model=model, messages=messages)
for choice in response.choices:
print(f"{choice.message.content}")
# Récupération de la question depuis l'argument de la ligne de commande
question = sys.argv[1] if len(sys.argv) > 1 else "Quelle est votre question ?"
api_key = os.getenv("MISTRAL_API_KEY", "YOUR_MISTRAL_API_KEY")
model = "mistral-large-latest"
try:
client = Mistral(api_key=api_key)
get_response(question, client)
except Exception as e:
print(f"Une erreur est survenue : {e}")
try:
del client
except TypeError:
pass
Esempio di Utilizzo
# Optionnel - Installer les dépendances si nécessaire :
pip install selenium
pip install mistralai
pip install webdriver_manager
# Définir la clé API Mistral AI
export MISTRAL_API_KEY="votre_clé_api"
# on rend le script executable
chmod 700 mistral-ai.py
./mistral-ai.py "Fais moi un résumé de ce site stp : https://docs.mistral.ai/"
### Résumé du Site de Mistral AI
#### Introduction
Mistral AI est un laboratoire de recherche spécialisé dans la création des meilleurs modèles open source au monde. La Plateforme permet aux développeurs et aux entreprises de créer de nouveaux produits et applications grâce aux modèles de langage (LLMs) open source et commerciaux de Mistral.
#### Modèles de Langage de Mistral AI
Mistral AI propose des modèles généralistes, spécialisés et de recherche, tous à la pointe de la technologie, et dotés de capacités multilingues, de génération de code, de mathématiques et de raisonnement avancé.
##### Modèles Généralistes
- **Mistral Large**: Le modèle de raisonnement de haut niveau pour des tâches complexes, avec la version v2 sortie en juillet 2024.
- **Mistral NeMo**: Le meilleur modèle multilingue open source, sorti en juillet 2024.
##### Modèles Spécialisés
- **Codestral**: Le modèle de langage de pointe pour le codage, sorti en mai 2024.
- **Mistral Embed**: Le modèle sémantique pour l'extraction de représentations de textes.
##### Modèles de Recherche
- **Mistral 7b**: Le premier modèle dense, sorti en septembre 2023.
- **Mixtral 8x7b**: Le premier modèle sparse mixture-of-experts, sorti en décembre 2023.
- **Mixtral 8x22b**: Le meilleur modèle open source à ce jour, sorti en avril 2024.
- **Mathstral 7b**: Le premier modèle de mathématiques open source, sorti en juillet 2024.
- **Codestral Mamba**: Le premier modèle mamba 2 open source, sorti en juillet 2024.
#### Exploration des APIs de Mistral AI
Les APIs de Mistral AI permettent de développer des applications LLM via différentes fonctionnalités :
- **Génération de texte** : Permet le streaming et l'affichage en temps réel des résultats partiels du modèle.
- **Génération de code** : Facilite les tâches de génération de code, y compris le remplissage de texte et la complétion de code.
- **Embeddings** : Utile pour la RAG (Retrieval-Augmented Generation) où il représente la signification du texte sous forme de liste de nombres.
- **Appel de fonctions** : Permet aux modèles Mistral de se connecter à des outils externes.
- **Fine-tuning** : Permet aux développeurs de créer des modèles personnalisés et spécialisés.
- **Mode JSON** : Permet aux développeurs de définir le format de réponse en objet JSON.
- **Guardrailing** : Permet aux développeurs d'appliquer des politiques au niveau système des modèles Mistral.
#### Liens Utiles
- **Quickstart**
- **Documentation**
- **Contribution**
- **Communauté**
- **Discord**
- **GitHub**
#### Droits d'Auteur
Copyright © 2024 Mistral AI.
Codice dello Script mistral-ai.py (obsoleto con le ultime versioni delle librerie)
#!/usr/bin/env python3
import re
import sys
import os
from selenium import webdriver
from selenium.webdriver.chrome.options import Options
from mistralai.client import MistralClient
from mistralai.models.chat_completion import ChatMessage
def get_web_content(url):
if not url:
return ""
# Configure Chrome options
chrome_options = Options()
# Create a new browser instance with the configured options
driver = webdriver.Chrome(options=chrome_options)
# Make a request to the web page
driver.get(url)
# Retrieve the JavaScript content of the page
web_content = driver.execute_script("return document.documentElement.innerText")
# Don't forget to close the browser when you're done
driver.quit()
return web_content
def get_response(question, client):
urls = re.findall(r'(https?://\S+)', question)
if urls: # Vérifiez si une URL a été fournie
for url in urls:
web_content = get_web_content(url)
if web_content:
# Remplacez l'URL par le contenu du web dans le prompt
question = question.replace(url, web_content)
messages = [ChatMessage(role="user", content=question)]
response = client.chat(model=model, messages=messages, safe_mode=False)
for choice in response.choices:
print(f"{choice.message.content}")
# Récupération de la question depuis l'argument de la ligne de commande
question = sys.argv[1] if len(sys.argv) > 1 else "Quelle est votre question ?"
api_key = os.getenv("MISTRAL_API_KEY", "YOUR_MISTRAL_API_KEY")
model = "mistral-small"
try:
client = MistralClient(api_key=api_key)
get_response(question, client)
except Exception as e:
print(f"Une erreur est survenue : {e}")
try:
del client
except TypeError:
pass
Spiegazione Dettagliata dello Script
Importazione dei Moduli
- os, sys: Utilizzati per le interazioni con il sistema operativo.
- argparse: Permette di gestire gli argomenti della riga di comando.
- re: Modulo per il trattamento delle espressioni regolari.
- webdriver: Permette di utilizzare Selenium per automatizzare le azioni in un browser web. ### Funzione
get_web_content
- Questa funzione utilizza Selenium per navigare verso un URL e recuperare il suo contenuto.
- È essenziale per arricchire i prompt con informazioni provenienti da Internet.
Funzione get_response
- Gestisce gli URL trovati nel prompt.
- Recupera il loro contenuto tramite
get_web_content
. - Invia il prompt arricchito a Mistral AI per ottenere una risposta.
Blocco main
- Punto di ingresso dello script.
- Gestisce gli argomenti della riga di comando.
- Inizializza il client Mistral AI e gestisce la risposta.
Utilizzo di Mistral AI
- Lo script interagisce con il modello
mistral-small
. - Invia il prompt, arricchito dal contenuto web, a Mistral AI per ottenere una risposta pertinente.
Questa panoramica dello script dà un’idea del suo funzionamento e della sua struttura, permettendo di capire come utilizza Python, Selenium e Mistral AI per automatizzare e arricchire le interazioni con l’IA.
Esempi di Utilizzo
# Optionnel - Vous aurez peut être besoin d'installer les dépendances :
pip install selenium
pip install mistralai
# Définir la clé API Mistral AI
export MISTRAL_API_KEY="votre_clé_api"
# on rend le script executable
chmod 700 mistral-ai.py
./mistral-ai.py "Résume en français ce contenu : https://platform.openai.com/docs/guides/prompt-engineering"
Ce guide partage des stratégies et tactiques pour obtenir de meilleurs résultats des grands modèles linguistiques (parfois appelés modèles GPT, tels que GPT-4). Les méthodes décrites peuvent être déployées en combinaison pour un effet plus important. L'expérimentation est encouragée pour trouver les méthodes qui fonctionnent le mieux pour vous.
Certains des exemples présentés fonctionnent actuellement uniquement avec le modèle le plus capable, gpt-4. En général, si vous constatez qu'un modèle échoue à une tâche et qu'un modèle plus capable est disponible, il vaut souvent la peine d'essayer à nouveau avec le modèle plus capable.
Des exemples de invites sont également fournis pour montrer ce que les modèles sont capables de faire.
Voici les six stratégies présentées dans le guide :
1. Rédiger des instructions claires
2. Fournir des détails dans votre requête pour obtenir des réponses plus pertinentes
3. Demander au modèle d'adopter une personnalité
4. Utiliser des délimiteurs pour indiquer distinctement les parties de l'entrée
5. Spécifier les étapes requises pour terminer une tâche
6. Fournir des exemples et spécifier la longueur de la sortie
Le guide décrit également des tactiques pour améliorer les performances des modèles, telles que la décomposition de tâches complexes en tâches plus simples, l'utilisation de références textuelles pour aider les modèles à fournir des réponses moins fabriquées, et l'utilisation de l\'exécution de code pour effectuer des calculs plus précis ou appeler des API externes.
Enfin, le guide présente des stratégies pour tester systématiquement les changements apportés aux systèmes en évaluant les sorties des modèles par rapport aux réponses standardisées.
# Sans url dans le prompt :
./mistral-ai.py "que sais tu faire ?"
Je suis capable de comprendre et de générer du langage naturel, ce qui me permet de répondre à une grande variété de questions,
de traduire du texte d'une langue à une autre, de résumer du texte, de répondre à des demandes de manière polie, et bien plus encore.
Je peux également effectuer des tâches telles que la recherche de informations sur le web, la programmation, la création de contenu
et l'automatisation de tâches.
Cependant, il est important de noter que mes compétences et connaissances sont limitées à ce qui m'a été appris et je suis dépendant
de la qualité de l'information avec laquelle je suis entrainé.
Questo documento è stato tradotto dalla versione fr alla lingua it utilizzando il modello gpt-4o. Per maggiori informazioni sul processo di traduzione, consultare https://gitlab.com/jls42/ai-powered-markdown-translator