Proxy Lite

AI产品8个月前发布 AI工具箱
0 0 0
Proxy Lite的封面图

Proxy Lite 是一款开源的轻量级视觉语言模型(VLM),其参数数量为 3B,专注于自动化网页操作。该模型能够像人类一样执行浏览器操作,包括网页交互、数据抓取和表单填写等重复性任务,从而显著降低自动化成本。它采用了“观察-思考-工具调用”三步决策机制,具备卓越的泛化能力,资源占用低,可高效运行于消费级 GPU。Proxy Lite 还提供了完整的浏览器交互框架,适用于网页自动化测试、数据提取、智能任务助手等多种应用场景,方便开发者快速部署和使用。

Proxy Lite 的主要功能包括:

  • 网页自动化操作:自动执行浏览器中的各种操作,如点击按钮、填写表单、滚动页面和处理弹窗等。
  • 网页数据抓取:解析网页内容,提取结构化数据,支持从新闻、社交媒体到电商平台等多种类型网页的数据抓取。
  • AI 驱动的交互式 Web 代理:结合视觉感知能力,进行 UI 自动化测试和前端行为分析。
  • 智能任务助手:帮助用户高效搜索、筛选和总结信息,提升网页导航的体验。
  • 低资源占用:仅需 3B 参数,在消费级 GPU 上高效运行,无需依赖大型云计算资源。

Proxy Lite 的技术原理包括:

  • 视觉语言模型(VLM):结合视觉感知(图像识别)与自然语言处理的能力,理解和操作网页内容。
  • 三步决策机制:包括“观察”、“思考”和“工具调用”,通过浏览器 API 进行交互操作,如点击、输入和滚动等。
  • 浏览器交互框架:内置完整浏览器控制框架,采用 Playwright 库驱动浏览器操作,支持无头模式和隐身模式,降低被检测的风险。
  • 执行反馈机制:借鉴其他模型的反馈机制,在任务执行过程中不断优化决策流程,提高执行准确性。

如需了解更多关于 Proxy Lite 的信息,可访问其 GitHub 仓库:https://github.com/convergence-ai/proxy-lite。Proxy Lite 的应用场景涵盖网页自动化操作、数据抓取、自动化测试、智能任务助手和企业级任务自动化等多个领域。该产品免费开源,支持在消费级 GPU 上高效运行,操作简便并无需高端设备。

© 版权声明

相关AI热点

没有相关内容!

暂无评论

none
暂无评论...