Bootstrap

AIGC学习笔记(6)——AI大模型开发工程师

AI大模型开发工程师

005 OpenAI大模型案例实践

1 AI 翻译助手需求分析

项目起源

image.png

市场价格和市场前景

image.png

基于大模型的翻译软件

image.png

核心功能设计

image.png

2 AI 翻译助手架构设计

架构设计

image.png

代码结构设计

image.png

3 AI 翻译助手核心功能

文档解析

image.png

文档操作
## 导入操作word文档和PDF文档的依赖库
! pip install pdfplumber
PDF文档操作
  • 读取文档
import pdfplumber
pdf = pdfplumber.open("测试文档/test1.pdf")
pages = pdf.pages

# 读取所有页面的文本内容
with pdfplumber.open("测试文档/test1.pdf") as pdf:
    for page in pdf.pages:
        print(page.extract_text())

# 获取单页文本(保留布局)
text = pages[0].extract_text(layout=True)
text
表格操作
table = pages[1].extract_table()
table

import pandas as pd

df = pd.DataFrame(table[1:], columns=table[0])

print(df)

image.png

图片操作
pages[2].images

img = pages[2].images[0]
bbox = (img["x0"], img["top"], img["x1"], img["bottom"])
cropped_page = pages[2].crop(bbox)
cropped_page.to_image()

image.png

Prompt封装
  • 方式一

image.png

  • 方式二:使用 LangChain

image.png

4 AI 翻译助手代码落地

  • github开源代码实现:

    • https://github.com/openai-translator/bob-plugin-openai-translator
    • https://github.com/openai-translator/openai-translator
  • 项目地址:https://github.com/shouwangyw/AIGC/tree/main/Code/005/ai-translator-helper

5 AI 翻译助手项目总结

image.png

;