2019年11月的文章

有挑战的反爬虫

k 近邻算法解决字体反爬手段 效果非常好

5

sfhfpc 发布于 2019-11-12 12-39-08

这种反爬虫手段通常被用来保护页面中的关键数据,例如影片票房、外卖平台的商家电话、汽车门户上的车型报价或者是电商平台上商品的属性和价格。 本篇文章要解决的问题,是如何让程序准确的识别那些用自定义字体代替的文字。

阅读(921)评论(1)赞 (7)

技术流综合知识

Python 系统资源信息获取工具 你用过没

12

sfhfpc 发布于 2019-11-10 18-32-36

如果你需要通过 Python 代码来监控服务器资源信息,比如内容占用情况、cpu 资源消耗以及资源不足发送警报等,那么这篇文章很适合你。 香香的口味,你吃过没? 辣辣的感觉,你尝过没? 网爆红人的歌声,你听过没? Python 系统资源信息获取的工具,你用过没? 真正的烤面筋 可...

阅读(307)评论(0)赞 (1)

技术流综合知识

Redis 数据持久化详解与实践 动图详解

23

sfhfpc 发布于 2019-11-10 18-02-32

Redis 是一个开源( BSD 许可)的,内存中的数据结构存储系统,它可以用作数据库、缓存和消息中间件。它支持的数据类型很丰富,如字符串、链表、集 合、以及散列等,并且还支持多种排序功能。 什么叫持久化? 用一句话可以将持久化概括为:将数据(如内存中的对象)保存到可永久保存的存...

阅读(191)评论(0)赞 (0)

流畅的爬虫之路

如何将 Scrapy 项目打包部署到服务器 动图详解

10

sfhfpc 发布于 2019-11-10 17-50-28

当爬虫代码编写完毕后,你可以选择直接运行启动文件来启动爬虫,也可以将爬虫部署到 Scrapyd 后,通过 Scrapyd 的 API 来启动爬虫。 那么如何将爬虫项目打包并部署到 Scrapyd 呢? 笔者 将通过两个具体的部署例子(部署到本地以及部署到云服务器)以熟悉 Scra...

阅读(448)评论(1)赞 (3)

优质的学习材料

MongoDB 进阶教程–流式聚合操作

5

sfhfpc 发布于 2019-11-10 16-50-31

信息科学中的聚合是指对相关数据进行内容筛选、处理和归类并输出结果的过程。MongoDB 中的聚合是指同时对多个文档中的数据进行处理、筛选和归类并输出结果的过程。数据在聚合操作的过程中,就像是水流过一节一节的管道一样,所以 MongoDB 中的聚合又被人称为流式聚合。MongoDB...

阅读(235)评论(0)赞 (0)

技术流综合知识

实战!手把手带你搭建图像分类 AI 服务 几分钟就能学会

31

sfhfpc 发布于 2019-11-10 15-28-33

人工智能技术(以下称 AI)是人类优秀的发现和创造之一,它代表着至少几十年的未来。在传统的编程中,工程师将自己的想法和业务变成代码,计算机会根据代码设定的逻辑运行。与之不同的是,AI 使计算机有了属于自己的思想,它就像生物一样,能够看、听、说、动、理解、分辨和思考。 AI 在图像...

阅读(204)评论(0)赞 (0)

令人头疼的算法

关于位运算,有这一篇就够了! 7 分钟即可掌握

10

sfhfpc 发布于 2019-11-10 15-08-33

位运算是我们在编程中常会遇到的操作,但仍然有很多开发者并不了解位运算,这就导致在遇到位运算时会“打退堂鼓”。实际上,位运算并没有那么复杂,只要我们了解其运算基础和运算符的运算规则,就能够掌握位运算的知识。接下来,我们一起学习位运算的相关知识。 程序中的数在计算机内存中都是以二进制...

阅读(325)评论(0)赞 (3)

关于作者

编程故事 转行自学 2 年的 Python 开发者

8

sfhfpc 发布于 2019-11-10 09-59-27

我毕业六年了,但与技术和 Python 相关的工作经验也就两年。今天我想跟大家分享自己转行的故事,希望能够鼓励那些跟我一样的朋友共同前行。 我们将会聊到我个人的经历和入行故事,个人的技术成就,我 2019 年上半年和下半年的工作重点,讨论快速学习的方法,最后推荐一些学习资源。 个...

阅读(427)评论(0)赞 (5)

关于作者

个人介绍 我取得过哪些成绩

4

sfhfpc 发布于 2019-11-10 09-58-27

韦世东 桂林人士|严以律己的散漫型自由开发者 《Python3 反爬虫原理与绕过实战》作者 在多种岗位上工作过 例如: 信息安全专员|微信公众号开发组长|技术组长|技术顾问|运营总监|副总经理|爬虫工程师 编程语言 Python|Swift 英雄联盟 艾欧尼亚|巨神峰 白银玩家 ...

阅读(707)评论(0)赞 (3)

关于作者

文字作品 有哪些拿的出手

3

sfhfpc 发布于 2019-11-10 09-57-35

本书描述了爬虫技术与反爬虫技术的对抗过程,并详细介绍了这其中的原理和具体的实现方法。 本书从开发环境配置到 Web 网站的构成和页面渲染,再到动态网页和静态网页对爬虫造成的影响。然后介绍了不同类型的反爬虫原理、具体实现和绕过方法。书中还讲解了常见验证码的实现过程,并使用深度学习技...

阅读(303)评论(0)赞 (0)