OmniMCP

Name: OmniMCP
Availability: InStock
Author: openadaptai

par openadaptai

Interaction UI et perception visuelle pilotées par l'IA utilisant Microsoft OmniParser et MCP.

0 étoiles

Fonctionne dans:claude

Expose:ToolsResources

Voir sur GitHub Documentation

Ce qu'il fait

OmniMCP comble le fossé entre les LLM et les interfaces utilisateur complexes. En exploitant l'OmniParser de Microsoft, il permet aux modèles d'IA de percevoir visuellement l'écran, d'identifier les éléments de l'UI et d'exécuter des actions précises de souris et de clavier pour atteindre des objectifs de manière autonome.

Outils

Perception Visuelle : Analyse les captures d'écran pour identifier et étiqueter les composants interactifs de l'UI.
Planificateur LLM : Génère une séquence d'actions basée sur l'état visuel actuel et l'objectif.
Exécuteur d'Agent : Orchestre la boucle percevoir-planifier-agir pour l'exécution continue des tâches.
Contrôleur d'Entrée : Effectue des interactions physiques via pynput pour le contrôle de la souris et du clavier.

Installation

{
  "mcpServers": {
    "omnimcp": {
      "command": "python",
      "args": ["/path/to/OmniMCP/cli.py"]
    }
  }
}

Hôtes supportés

Claude Desktop
Linux (X11/Wayland)

Installation rapide

git clone https://github.com/OpenAdaptAI/OmniMCP.git && cd OmniMCP && ./install.sh

Informations

Tarification: free
Publié: 5/1/2026
étoiles: 0

Catégories

Developer Tools

Choisissez votre client IA et suivez les étapes ci-dessous.

Claude Desktop

Add to claude_desktop_config.json with python and cli.py path

Apps similaires

FinanceToolkit

MCP Server

Professional-grade financial analysis toolkit for equities, options, and risk management.

DiffSitter MCP

MCP Server

AI-powered structural code navigation using tree-sitter ASTs for semantic understanding across 14+ languages.

OpenAI Apps SDK Examples

MCP App

Official example gallery of interactive MCP widgets for ChatGPT — 3D viewers, maps, carousels, shopping carts, and more.

Human MCP

MCP Server

Give AI agents human-like senses: visual analysis, image/video generation, speech synthesis, browser automation, and advanced reasoning — 29 MCP tools in one se

Containarium

MCP Server

Self-hostable agent runtime with SSH-native isolation, eBPF egress policy, and MCP-native CLI.

Shopify MCP Server

MCP Server

Direct interaction with Shopify store data via GraphQL API for managing products, customers, and orders.

Git MCP Server

MCP Server

Full-featured Git MCP server exposing 28 tools for AI agents to clone, commit, branch, diff, merge, rebase, and more via STDIO or Streamable HTTP.

CodexPotter

MCP Server

Autonomous reconciliation loop that drives Codex to align your codebase with instructed states.

Retour aux applications

OmniMCP

par openadaptai

Interaction UI et perception visuelle pilotées par l'IA utilisant Microsoft OmniParser et MCP.

0 étoiles

Fonctionne dans:claude

Expose:ToolsResources

Voir sur GitHub Documentation

Ce qu'il fait

Outils

Perception Visuelle : Analyse les captures d'écran pour identifier et étiqueter les composants interactifs de l'UI.
Planificateur LLM : Génère une séquence d'actions basée sur l'état visuel actuel et l'objectif.
Exécuteur d'Agent : Orchestre la boucle percevoir-planifier-agir pour l'exécution continue des tâches.
Contrôleur d'Entrée : Effectue des interactions physiques via pynput pour le contrôle de la souris et du clavier.

Installation

{
  "mcpServers": {
    "omnimcp": {
      "command": "python",
      "args": ["/path/to/OmniMCP/cli.py"]
    }
  }
}

Hôtes supportés

Claude Desktop
Linux (X11/Wayland)

Installation rapide

git clone https://github.com/OpenAdaptAI/OmniMCP.git && cd OmniMCP && ./install.sh

Informations

Tarification: free
Publié: 5/1/2026
étoiles: 0

Catégories

Developer Tools

Choisissez votre client IA et suivez les étapes ci-dessous.

Claude Desktop

Add to claude_desktop_config.json with python and cli.py path

Apps similaires

FinanceToolkit

MCP Server

Professional-grade financial analysis toolkit for equities, options, and risk management.

DiffSitter MCP

MCP Server

AI-powered structural code navigation using tree-sitter ASTs for semantic understanding across 14+ languages.

OpenAI Apps SDK Examples

MCP App

Official example gallery of interactive MCP widgets for ChatGPT — 3D viewers, maps, carousels, shopping carts, and more.

Human MCP

MCP Server

Give AI agents human-like senses: visual analysis, image/video generation, speech synthesis, browser automation, and advanced reasoning — 29 MCP tools in one se

Containarium

MCP Server

Self-hostable agent runtime with SSH-native isolation, eBPF egress policy, and MCP-native CLI.

Shopify MCP Server

MCP Server

Direct interaction with Shopify store data via GraphQL API for managing products, customers, and orders.

Git MCP Server

MCP Server

Full-featured Git MCP server exposing 28 tools for AI agents to clone, commit, branch, diff, merge, rebase, and more via STDIO or Streamable HTTP.

CodexPotter

MCP Server

Autonomous reconciliation loop that drives Codex to align your codebase with instructed states.