使用Python调用Deepseek生成高质量Word/PDF文档,实现自动化办公的高效操作
deepseek结合pandoc自动化生成doc
首先下载pandoc pandoc下载地址
博主下载的zip压缩包,下载解压一下即可。
记住这里的地址,后面需要用到。
python调用deepseek的方法请参考另一篇博客python调用deepseek,这里不再赘述。下面就是通过请求deepseek获取到答案(markdown形式)后,我们怎么把markdown转为docx或者pdf。
markdown转docx
def use(word):
global result
payload = {
"model": "deepseek-r1:8b", # 模型名称
"prompt": word, # 输入文本
"stream": False, # 启用流式输出
"max_tokens": 500, # 最大生成长度
"temperature": 0.7, # 温度参数
}
# 发送 POST 请求,启用流式响应
response = requests.post(OLLAMA_URL, json=payload, stream=True)
# 检查响应状态码
if response.status_code == 200:
print("开始生成文本...\n")
# 逐块处理流式响应
for chunk in response.iter_lines():
if chunk:
# 解析 JSON 数据
data = json.loads(chunk.decode("utf-8"))
# 获取生成的文本片段
generated_text = data.get("response", "")
result = re.sub(r"<think>.*?</think>", "", generated_text, flags=re.DOTALL).strip()
print(result)
print("\n\n生成完成!")
else:
print("请求失败,状态码:", response.status_code)
print("错误信息:", response.text)
return result
通过请求deepseek获取答案,这个答案里面包含有模型思考过程的内容,这是我们不需要的,所以通过result = re.sub(r”.*?”, “”, generated_text, flags=re.DOTALL).strip()过滤掉,最后返回我们需要的文本。
def convert_md_string_to_docx(md_string, output_docx_path):
# 创建一个临时的 Markdown 文件
with tempfile.NamedTemporaryFile(delete=False, suffix=".md") as temp_md_file:
temp_md_file.write
作者:苦逼的杨同学