Python 爬取微信聊天记录并分析聊天内容_python自动抓取微信聊天内容
下载微信聊天记录爬取程序:(软件安全正常,直接无视安全问题😎)
https://github.com/LC044/WeChatMsg/releases/download/v1.0.6/MemoTrace-1.0.6.exe
电脑需要登录微信,如果电脑微信聊天记录不齐全,可以通过手机进行微信聊天记录迁移。
打开软件,随后点击获取信息,获取手机号、微信昵称、wxid等内容,之后点击开始启动就行。
若出现wxid或微信路径无法获取问题,查看解决办法(”留痕”使用教程 (lc044.love)”)),一般都是没问题的。
选择 “数据 –> 批量导出”,选择你想要导出的联系人信息。导出格式选择csv格式,方便我们后续利用python进行数据分析:
导出后的结果在程序同目录下的“data –> 聊天记录“文件中,我们需要csv文件,记住csv文件的地址,自此微信聊天记录爬取结束👌。
PS:上述软件也可以进行数据分析,作者也贴出年度报告,各位可以尝试一下,不过内容较少且存在乱码。
二、内容分析可视化展示:
环境配置:python3.8(3.10matplotlib不兼容问题) numpy pandas seaborn jieba july wordcloud
接下来直接内容分析代码,代码中需要根据你的CSV文件地址修改以及聊天双方名字修改:
import matplotlib.pyplot as plt
import pandas as pd
import re
import july
import jieba
from july.utils import date_range
import seaborn as sns
from scipy.stats import norm
import numpy as np
from wordcloud import WordCloud
from collections import Counter
def set_chinese_font():
# 设置中文
作者:普通网友