添加链接

注册登录

link之家

链接快照平台

输入网页链接，自动生成快照
标签化管理网页链接

相关文章推荐

温柔的沙滩裤 · 华为d14笔记本能玩七日世界吗-西瓜视频· 2 月前 ·

坚韧的李子 · 《九龍城寨之圍城》衝破$7,000萬票房！登 ...· 7 月前 ·

无邪的木瓜 · 边境贸易正迸发旺盛活力· 8 月前 ·

俊逸的火锅 · 上海市经济信息化委市财政局关于印发 ...· 1 年前 ·

飘逸的作业本 · 特斯拉官宣：现车大降价· 1 年前 ·

首发于 python爬虫

切换模式

教你通杀字体反爬？

亮哥数据实验室

微信公众号->亮哥数据实验室 | v->lgDataLabs

声明

本文章中所有内容仅供学习交流，抓包内容、敏感网址、数据接口均已做脱敏处理，严禁用于商业用途和非法用途，否则由此产生的一切后果均与作者无关，若有侵权，请联系我立即删除！

背景

随着科技的快速发展，网络数据的获取也面临着瓶颈，例如字体反爬，从刚开始的静态字体，到目前主流的动态字体，这种方式的反爬是根据一套或者多套字体通过页面映射替换而成的，无法通过自动化去获取（例如：Selenium），这给很多新入门的小伙伴带来了很大困难。本篇文章通过聚类算法——KNN去训练，预测得到目标字体，进行网页替换即可。

关于什么是字体反爬，可以参考字体反爬原理与Knn解决方案

本篇以好租为案例，熟悉字体反爬

1、运行环境与所需工具

本次运行环境为Python3.8，所需包如下：

import requests
import re
import base64
from fontTools.ttLib import TTFont
import pandas as pd
import time
import numpy as np
import pandas as pd

推荐文章

温柔的沙滩裤 · 华为d14笔记本能玩七日世界吗-西瓜视频

2 月前

坚韧的李子 · 《九龍城寨之圍城》衝破$7,000萬票房！登上香港華語片總票房第4位！盤點香港最高票房華語片Top10︰邊部以過億票房排第1？ - 玩樂 What’s On - 吃喝玩樂 - Lifestyle Ch

7 月前

无邪的木瓜 · 边境贸易正迸发旺盛活力

8 月前

俊逸的火锅 · 上海市经济信息化委市财政局关于印发《上海市重点产业领域人才专项奖励实施办法》的通知（本办法自2022年12月2日起实施，有效期至2024年12月1日）

1 年前

飘逸的作业本 · 特斯拉官宣：现车大降价

1 年前

今天看啥 · Py中国 · codingpro · 小百科 · link之家 · 卧龙AI搜索

删除内容请联系邮箱 2879853325@qq.com

link之家 - 链接快照平台

© 2024 ~ 沪ICP备11025650号