使用Python调用Deepseek生成高质量Word/PDF文档,实现自动化办公的高效操作

deepseek结合pandoc自动化生成doc

首先下载pandoc pandoc下载地址
博主下载的zip压缩包,下载解压一下即可。


记住这里的地址,后面需要用到。
python调用deepseek的方法请参考另一篇博客python调用deepseek,这里不再赘述。下面就是通过请求deepseek获取到答案(markdown形式)后,我们怎么把markdown转为docx或者pdf。

markdown转docx

def use(word):
    global result
    payload = {
   
        "model": "deepseek-r1:8b",  # 模型名称
        "prompt": word,  # 输入文本
        "stream": False,  # 启用流式输出
        "max_tokens": 500,  # 最大生成长度
        "temperature": 0.7,  # 温度参数
    }

    # 发送 POST 请求,启用流式响应
    response = requests.post(OLLAMA_URL, json=payload, stream=True)

    # 检查响应状态码
    if response.status_code == 200:
        print("开始生成文本...\n")
        # 逐块处理流式响应
        for chunk in response.iter_lines():
            if chunk:
                # 解析 JSON 数据
                data = json.loads(chunk.decode("utf-8"))
                # 获取生成的文本片段

                generated_text = data.get("response", "")
                result =  re.sub(r"<think>.*?</think>", "", generated_text, flags=re.DOTALL).strip()
                print(result)
        print("\n\n生成完成!")
    else:
        print("请求失败,状态码:", response.status_code)
        print("错误信息:", response.text)
    return result

通过请求deepseek获取答案,这个答案里面包含有模型思考过程的内容,这是我们不需要的,所以通过result = re.sub(r”.*?”, “”, generated_text, flags=re.DOTALL).strip()过滤掉,最后返回我们需要的文本。

def convert_md_string_to_docx(md_string, output_docx_path):
    # 创建一个临时的 Markdown 文件
    with tempfile.NamedTemporaryFile(delete=False, suffix=".md") as temp_md_file:
        temp_md_file.write

作者:苦逼的杨同学

物联沃分享整理
物联沃-IOTWORD物联网 » 使用Python调用Deepseek生成高质量Word/PDF文档,实现自动化办公的高效操作

发表回复