Este artículo presenta un script que fue desarrollado como una Prueba de Concepto (POC) para explorar y familiarizarse con las capacidades de la API de OpenAI.

Introducción

Este script de Python está diseñado para automatizar la generación de respuestas utilizando el modelo de lenguaje GPT-4 de OpenAI. También utiliza Selenium para web scraping con el fin de recuperar el contenido de las URLs especificadas en los prompts.

Diseño del script con la asistencia de GPT-4

El desarrollo de este script de Python se benefició de la asistencia de la IA ChatGPT-4, lo que ilustra la fuerza de la herramienta como colaboradora en el proceso de creación de código.

Objetivos del POC

El objetivo era experimentar con la API de OpenAI en Python para desarrollar mis habilidades. No solo quería proporcionar un prompt a la API, sino también enriquecer este prompt con contenido web, si fuera necesario, integrando una URL en el prompt.

  • Demostrar la integración de la API de OpenAI: Utilizar la API de OpenAI en un contexto de script de Python para comprender cómo interactuar con modelos de lenguaje avanzados como GPT-4.
  • Experimentar con Web Scraping: Emplear Selenium para recuperar dinámicamente el contenido de páginas web, una habilidad útil para diversas aplicaciones de automatización.
  • Explorar las posibilidades de automatización con IA: Comprender cómo la IA puede ser utilizada para automatizar y enriquecer tareas como la generación de contenido o la respuesta a preguntas.

Aplicaciones Potenciales del Script

Este script puede servir como punto de partida para proyectos más complejos que involucren IA. Ofrece una visión general de lo que es posible al combinar web scraping e IA, y puede inspirar otras aplicaciones como:

  • Automatización de resúmenes de contenido.
  • Enriquecimiento de bases de datos con información recuperada en línea.
  • Creación de asistentes virtuales personalizados.

Observaciones Importantes

  • Este script es un POC: Está destinado a fines educativos y experimentales, no para uso en producción.
  • Siempre respetar las reglas de uso de las API y los sitios web: Al utilizar la API de OpenAI y hacer scraping de sitios web, asegúrese de respetar los términos de uso y las políticas de privacidad.

Código del Script open-ai.py

Aquí está el script completo de Python que he creado:

#!/usr/bin/env python3
import os
import sys
import argparse
import re
from openai import OpenAI
from selenium import webdriver
from selenium.webdriver.chrome.options import Options

def get_web_content(url):
    if not url:
        return ""

    # Configure Chrome options
    chrome_options = Options()

    # Create a new browser instance with the configured options
    driver = webdriver.Chrome(options=chrome_options)

    # Make a request to the web page
    driver.get(url)

    # Retrieve the JavaScript content of the page
    web_content = driver.execute_script("return document.documentElement.innerText")

    # Don't forget to close the browser when you're done
    driver.quit()

    return web_content

def get_response(prompt, client):
    urls = re.findall(r'(https?://\S+)', prompt)
    for url in urls:
        web_content = get_web_content(url)
        if web_content:
            # Remplacez l'URL par le contenu du web dans le prompt
            prompt = prompt.replace(url, web_content)

    try:
        response = client.chat.completions.create(
            model="gpt-4-1106-preview",
            messages=[
                {"role": "system", "content": "Vous discutez avec un assistant AI utile et informé qui répond en français."},
                {"role": "user", "content": prompt}
            ]
        )
        first_choice_message = response.choices[0].message
        return first_choice_message.content
    except Exception as e:
        return f"Une erreur est survenue : {e}"


def main():
    parser = argparse.ArgumentParser()
    parser.add_argument("prompt", nargs="?", help="The prompt containing URLs")
    args = parser.parse_args()

    openai_api_key = os.getenv("OPENAI_API_KEY")
    if not openai_api_key:
        raise ValueError("La clé API OPENAI_API_KEY n'est pas définie dans les variables d'environnement.")
    
    with OpenAI(api_key=openai_api_key) as client:
        prompt = args.prompt or sys.stdin.read()
        response = get_response(prompt, client)
        print(response)

if __name__ == "__main__":
    main()

Explicación Detallada del Script

Importación de Módulos

  • os, sys: Utilizados para interacciones del sistema.
  • argparse: Maneja los argumentos de línea de comandos.
  • re: Permite el procesamiento de expresiones regulares.
  • OpenAI, webdriver: Integran respectivamente las API de OpenAI y el navegador a través de Selenium.

Función get_web_content

Esta función utiliza Selenium para navegar a una URL dada y recuperar su contenido, lo cual es esencial para integrar el contenido web en los prompts de OpenAI.

Función get_response

Procesa las URLs en el prompt, recupera su contenido a través de get_web_content, luego interactúa con la API de OpenAI para obtener una respuesta basada en ese contenido.

Bloque main

El núcleo del script, gestionando los argumentos de línea de comandos, configurando el acceso a la API de OpenAI, y llamando a get_response para producir y mostrar el resultado.

Ejemplos de Uso

# Optionnel - Vous aurez peut être besoin d'installer les dépendances : 
pip install selenium
pip install openai

# on ajoute dans l'environnement du shell la clé OpenAPI générée via https://platform.openai.com/api-keys
export OPENAI_API_KEY="sk-xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx"

# on rend le script executable
chmod 700 open-ai.py

# ensuite on pose la ou les questions que l'on souhaite et si besoin on précise une url avec du contenu à intégrer au prompt
./open-ai.py "fais moi un résumé de : https://platform.openai.com/docs/guides/prompt-engineering"
Le présent guide propose des stratégies et des tactiques pour obtenir de meilleurs résultats de modèles de langage de grande taille, comme le GPT-4. 
Les méthodes décrites peuvent être combinées pour optimiser l'efficacité. 
Il est encouragé d'expérimenter pour découvrir les méthodes les plus adéquates.

Si un modèle échoue à accomplir une tâche, essayer avec un modèle plus performant peut être bénéfique.

Voici un aperçu des stratégies abordées dans le guide :

1. **Écrire des instructions claires :** Soyez précis, adoptez des formats spécifiques, et fournissez des détails pour personnaliser les réponses.

2. **Fournir du texte de référence :** Donner des textes de référence peut aider le modèle à fournir des réponses avec moins de fabrications.

3. **Diviser les tâches complexes en sous-tâches :** Aborder une tâche complexe par étapes peut réduire les erreurs.

4. **Donner du temps au modèle pour "réfléchir" :** Encourager un raisonnement pas à pas avant de conclure aide à obtenir des réponses plus correctes.

5. **Utiliser des outils externes :** Combiner le modèle avec d'autres outils peut améliorer les résultats.

6. **Tester systématiquement les changements :** L'évaluation systématique peut aider à déterminer si un changement est bénéfique ou non.

Des exemples spécifiques de chacune de ces stratégies sont donnés pour illustrer comment elles peuvent être mises en œuvre.

Pour plus d'informations et inspirations, consultez le OpenAI Cookbook, des bibliothèques d'invitations et d'autres ressources externes.


# Sans url dans le prompt :
./open-ai.py "que sais tu faire ?"
En tant qu'assistant AI, je suis conçu pour réaliser une variété de tâches utiles. Voici quelques exemples de ce que je peux faire :

1. **Répondre à des questions**: Fournir des réponses sur un large éventail de sujets, incluant la science, la géographie, l'histoire, la culture, et plus.

2. **Aide à l'apprentissage**: Expliquer des concepts complexes ou aider à comprendre des matières académiques.

3. **Discussion et conseils**: Offrir une conversation amicale, donner des conseils ou simplement écouter.

4. **Traduction**: Traduire des mots, phrases ou textes d'une langue à une autre.

5. **Rédaction et édition de texte**: Aider à rédiger des emails, des lettres, des articles de blog ou à corriger la grammaire et l'orthographe.

6. **Recherche d'informations**: Trouver des données spécifiques, résumer des recherches ou compiler des informations.

7. **Assistance technique**: Fournir des informations de base sur le dépannage informatique ou électronique.

8. **Programmation et informatique**: Aider à comprendre des concepts de programmation ou résoudre des problèmes logiques simples.

9. **Assistance aux affaires**: Aider avec des problèmes de marketing, de gestion ou d'autres questions commerciales.

10. **Divertissement**: Raconter des histoires, des blagues, ou fournir des informations sur des films, des jeux vidéo, et d'autres formes de divertissement.

11. **Conseils de santé et de fitness**: Donner des informations de base et des conseils généraux sur le bien-être et l'exercice physique (mais pas des conseils médicaux professionnels).

12. **Cuisine et recettes**: Fournir des recettes et des conseils de cuisine.

13. **Voyage**: Aider à planifier des voyages, donner des informations touristiques et des conseils de voyage.

14. **Gestion de l'agenda et rappels**: Gérer un calendrier virtuel et rappeler des événements ou des tâches importantes.

Il est important de noter que mon but est de fournir des informations et de l'aide, mais je ne remplace pas les services professionnels comme l'assistance médicale, juridique, ou d'autres conseils professionnels spécialisés.

Este documento ha sido traducido de la versión fr a la lengua es utilizando el modelo claude-3-opus-20240229. Para obtener más información sobre el proceso de traducción, consulte https://gitlab.com/jls42/ai-powered-markdown-translator