博客
关于我
「docker实战篇」python的docker-抖音分析接口数据分析(21)
阅读量:345 次
发布时间:2019-03-04

本文共 911 字,大约阅读时间需要 3 分钟。

安装Xposed和JustTruestMe后,抖音数据采集的配置工作也已完成。以下是具体的操作流程:

1. 简单配置

  • 使用Xposed框架设置代理服务器,确保网络请求通过指定的mitmproxy代理端口。
  • 在Android系统中启用Xposed框架,并将相应的插件加载进系统。

2. 数据采集流程

  • 打开Fildder工具,进入指定的粉丝界面。
  • 初始化请求,观察网络数据流。
  • 使用mitmdump工具捕获后台代理数据,通过Python脚本解析并存储到MongoDB数据库。

3. Python脚本配置

import jsonfrom handle_mongo import save_taskdef response(flow):    if 'aweme/v1/user/follower/list' in flow.request.url:        followers = json.loads(flow.response.text)['followers']        for user in followers:            info = {                'share_id': user['uid'],                'douyin_id': user['short_id'],                'nickname': user['nickname']            }            save_task(info)

4. 工具使用建议

  • 找到项目目录,执行命令:
    pip install mitmproxy
  • 使用mitmdump命令启动截获:
    mitmdump -s handle_mongo.py -p 8080
  • 将代理输出数据处理后,自动化存储到数据库中。

注意事项

  • 确保mitmproxy服务已启动,并检查代理端口是否正确。
  • 数据处理脚本需与MongoDB服务保持通信,确保数据库连接无误。
  • 后台输出信息需实时查看,及时处理可能的错误或异常。

通过以上步骤,可以实现自动化的抖音粉丝数据采集,减少人工干预,提高数据处理效率。

转载地址:http://vope.baihongyu.com/

你可能感兴趣的文章
pandas 根据值从多列中的一列查找
查看>>
Pandas 根据布尔条件选择行和列
查看>>
pandas 滚动窗口 - datetime64[ns] 未实现
查看>>
pandas 版本兼容特定的蟒蛇和NumPy配置吗?
查看>>
pandas 生成excel多级表头
查看>>
Pandas 的 DataFrame 详解-ChatGPT4o作答
查看>>
pandas 读取excel数据,以字典形式输出
查看>>
Pandas 读取具有浮点值的 csv 文件会导致奇怪的舍入和小数位数
查看>>
pandas 适用,但仅适用于满足条件的行
查看>>
pandas 重新采样到每月的特定工作日
查看>>
pandas :如何删除以NaN为列名的多个列?
查看>>
pandas :我如何对堆叠的条形图进行分组?
查看>>
pandas :按移位分组和累加和(GroupBy Shift And Cumulative Sum)
查看>>
pandas :检测一个DF和另一个DF之间缺失的列
查看>>
Pandas-从具有嵌套列表列表的现有列创建动态列时出错
查看>>
Pandas-通过对列和索引的值求和来合并两个数据框
查看>>
pandas.columns、get_dummies等用法
查看>>
pandas.DataFrame.copy(deep=True) 实际上并不创建深拷贝
查看>>
pandas.read_csv()的详解-ChatGPT4o作答
查看>>
PANDAS.READ_EXCEL()输出‘;溢出错误:日期值超出范围‘;而不存在日期列
查看>>