swarms/multi_modal_auto_agent.py

import os

from dotenv import load_dotenv

from swarms.models.gpt4_vision_api import GPT4VisionAPI
from swarms.prompts.multi_modal_autonomous_instruction_prompt import (
    MULTI_MODAL_AUTO_AGENT_SYSTEM_PROMPT_1,
)
from swarms.structs import Agent

load_dotenv()

api_key = os.environ.get("OPENAI_API_KEY")

llm = GPT4VisionAPI(
    openai_api_key=api_key,
)

task = "What is the color of the object?"
img = "images/swarms.jpeg"

## Initialize the workflow
agent = Agent(
    llm=llm,
    max_loops="auto",
    sop=MULTI_MODAL_AUTO_AGENT_SYSTEM_PROMPT_1,
    autosave=True,
    dashboard=True,
)

out = agent.run(task=task, img=img)
print(out)
[BUG][OpenAIChat model name][GPT4VisionAPI][system prompt] 1 year ago			`import os`

			`from dotenv import load_dotenv`

gpt4vision api 1 year ago			`from swarms.models.gpt4_vision_api import GPT4VisionAPI`
[FEAT][Flow.run() img = None for conditional img inputs, BaseMultiModalModel, and multi modal swarms of manufacturing agents 1 year ago			`from swarms.prompts.multi_modal_autonomous_instruction_prompt import (`
			`MULTI_MODAL_AUTO_AGENT_SYSTEM_PROMPT_1,`
			`)`
[BUG][OpenAIChat model name][GPT4VisionAPI][system prompt] 1 year ago			`from swarms.structs import Agent`

			`load_dotenv()`
gpt4vision api 1 year ago
[BUG][OpenAIChat model name][GPT4VisionAPI][system prompt] 1 year ago			`api_key = os.environ.get("OPENAI_API_KEY")`
gpt4vision api 1 year ago
[BUG][OpenAIChat model name][GPT4VisionAPI][system prompt] 1 year ago			`llm = GPT4VisionAPI(`
			`openai_api_key=api_key,`
			`)`
gpt4vision api 1 year ago
			`task = "What is the color of the object?"`
			`img = "images/swarms.jpeg"`

			`## Initialize the workflow`
flow -> agent, developer swarm with prompts, maybe add the ability to create the classes 1 year ago			`agent = Agent(`
gpt4vision api 1 year ago			`llm=llm,`
tests for gpt4visionapi 1 year ago			`max_loops="auto",`
code quality 1 year ago			`sop=MULTI_MODAL_AUTO_AGENT_SYSTEM_PROMPT_1,`
[DOCS] 1 year ago			`autosave=True,`
			`dashboard=True,`
gpt4vision api 1 year ago			`)`

[BUG][OpenAIChat model name][GPT4VisionAPI][system prompt] 1 year ago			`out = agent.run(task=task, img=img)`
			`print(out)`