博客
关于我
「docker实战篇」python的docker-抖音分析接口数据分析(21)
阅读量:345 次
发布时间:2019-03-04

本文共 911 字,大约阅读时间需要 3 分钟。

安装Xposed和JustTruestMe后,抖音数据采集的配置工作也已完成。以下是具体的操作流程:

1. 简单配置

  • 使用Xposed框架设置代理服务器,确保网络请求通过指定的mitmproxy代理端口。
  • 在Android系统中启用Xposed框架,并将相应的插件加载进系统。

2. 数据采集流程

  • 打开Fildder工具,进入指定的粉丝界面。
  • 初始化请求,观察网络数据流。
  • 使用mitmdump工具捕获后台代理数据,通过Python脚本解析并存储到MongoDB数据库。

3. Python脚本配置

import jsonfrom handle_mongo import save_taskdef response(flow):    if 'aweme/v1/user/follower/list' in flow.request.url:        followers = json.loads(flow.response.text)['followers']        for user in followers:            info = {                'share_id': user['uid'],                'douyin_id': user['short_id'],                'nickname': user['nickname']            }            save_task(info)

4. 工具使用建议

  • 找到项目目录,执行命令:
    pip install mitmproxy
  • 使用mitmdump命令启动截获:
    mitmdump -s handle_mongo.py -p 8080
  • 将代理输出数据处理后,自动化存储到数据库中。

注意事项

  • 确保mitmproxy服务已启动,并检查代理端口是否正确。
  • 数据处理脚本需与MongoDB服务保持通信,确保数据库连接无误。
  • 后台输出信息需实时查看,及时处理可能的错误或异常。

通过以上步骤,可以实现自动化的抖音粉丝数据采集,减少人工干预,提高数据处理效率。

转载地址:http://vope.baihongyu.com/

你可能感兴趣的文章
PANDA VALUE_COUNTS包含GROUP BY之前的所有值
查看>>
Pandas - 有条件的删除重复项
查看>>
pandas -按连续日期时间段分组
查看>>
pandas -更改重新采样的时间序列的开始和结束日期
查看>>
pandas :to_excel() float_format
查看>>
pandas :加入有条件的数据框
查看>>
pandas :将多列汇总为一列,没有最后一列
查看>>
pandas :将时间戳转换为 datetime.date
查看>>
pandas :将行取消堆叠到新列中
查看>>
pandas DataFrame 中的自定义浮点格式
查看>>
Pandas DataFrame 的 describe()方法详解-ChatGPT4o作答
查看>>
Pandas DataFrame中删除列级的方法链接解决方案
查看>>
Pandas DataFrame中的列从浮点数输出到货币(负值)
查看>>
Pandas DataFrame中的列从浮点数输出到货币(负值)
查看>>
Pandas DataFrame多索引透视表-删除空头和轴行
查看>>
pandas DataFrame的一些操作
查看>>
Pandas Dataframe的日志文件
查看>>
pandas GROUPBY+变换和多列
查看>>
pandas Groupby:创建两列的Groupby时,如何按正确的顺序对工作日进行排序?
查看>>
Pandas matplotlib 无法显示中文
查看>>