一、下载Browser-Use
Browser-Use 是一个Github 上开源的 Python 自动化项目,提供了简单易用的可视化 WebUI 操作界面,旨在让 AI 代理能够像人类一样自然地浏览和操作网页。它通过集成 Playwright 等浏览器自动化工具,结合大型语言模型(LLM),无需编程,用自然语言来实现网页自动化任务。
注意:该项目Python 版本必须在 3.11 以上,否则安装依赖时会提示不适配
https://github.com/browser-use/web-ui
1、拉取项目
git clone https://github.com/browser-use/web-ui.git
2、安装依赖
pip install browser-use
pip install -r requirements.txt
3、安装playwright
对于playwright的安装与介绍详见我之前的文章:
playwright install
4、配置环境变量
基于 .env.example 复制一个 .env 文件,并在 .env 文件中修改以下信息
# Chrome 浏览器路径
# Mac OS "/Applications/Google Chrome.app/Contents/MacOS/Google Chrome"
# Windows "C:\Program Files\Google\Chrome\Application\chrome.exe"
CHROME_PATH="/Applications/Google Chrome.app/Contents/MacOS/Google Chrome"
# Chrome 浏览器的用户数据路径
# Mac OS "/Users/<YourUsername>/Library/Application Support/Google/Chrome"
# Windows "C:\Users\<YourUsername>\AppData\Local\Google\Chrome\User Data"
CHROME_USER_DATA="/Users/<YourUsername>/Library/Application Support/Google/Chrome"
# 大模型的API Key(以deepseek举例)
DEEPSEEK_API_KEY=your key
deepseek key获取地址:https://platform.deepseek.com/api_keys
...
例如:
5、启动项目
python webui.py --ip 127.0.0.1 --port 7788
6、打开本地URL
浏览器访问http://127.0.0.1:7788/
7、配置deepseek(此处举例直接调用deepseek)
直接调用deepseek
自然语言指令
PS:直接调用deepseek,是需要充值的,余额不足,会无法调用大模型
故而,请看下面的ollama本地部署deepseek,免费调用
本地部署deepseek,详见我的文章:【本地部署deep seekseek】-CSDN博客
如果完成ollama本地部署deepseek后,LLM这里改为ollama,并选择下载好的deepseek模型即可,