王平
从技术开发到产品运营两手抓,两手都不硬的互联网从业者...
-
聊下近况-下岗待就业三个月
离开上一段6年多时间的创业不知不觉已经三个多月,写写我的近况,给大家汇报一下。嗯,离开后这三个月我没有去上班,天天窝在家里...6年前 (2019-10-15) 阅读(21674) 评论(10) -
如何利用人脸识别自动切分视频
前些天被问到这样一个问题,能不能做视频分镜头,更确切的是自动切分视频片段。拿央视的新闻联播来说,30分钟的新闻联播,可能包含...6年前 (2019-09-23) 阅读(12736) 评论(0) -
用python实现基于凝固度和自由度的新词发现程序
今天写篇技术硬文,看看大家喜不喜欢。互联网每年甚至每时刻都会催生很多新词(在新华词典里找不到的词语),比如”双一流R...6年前 (2019-09-09) 阅读(13582) 评论(0) -
基于OpenCV+dlib开发一个人脸识别应用
最近在做一个人脸识别的应用,Android系统的摄像头检测到人脸并识别出是谁。这样一个系统看似简单,但架构比较复杂,移动设备本身...6年前 (2019-09-05) 阅读(13277) 评论(0) -
反爬虫的四种常见方式-JS逆向方法论
现在的网页代码搞得越来越复杂,除了使用vue等前端框架让开发变得容易外,主要就是为了防爬虫,所以写爬虫下的功夫就越来越多。攻和...6年前 (2019-08-19) 阅读(22907) 评论(1) -
学会Lambda,让程序Pythonic一点
Lambda是Python里的高阶用法,要把代码写得Pythonic,就需要了解这些高阶用法,想说自己是一名真正的Python程序员,先要把代码写得...6年前 (2019-08-15) 阅读(19003) 评论(2) -
Python挣钱系列:数据整合之-结构化企业数据
之前写了一系列利用Python技术和爬虫技术挣钱的文章,老读者会发现我钟情于写数据整合方面的。没错,每个人都有自己开窍的一面,我...6年前 (2019-08-10) 阅读(12762) 评论(0) -
为什么你还是学不会编程
常有小伙伴问我,怎么学Python,学了语法为什么还是写不出代码。这个问题其实有点难回答,敷衍的回答就是:多看书、多练习、灵活运...6年前 (2019-07-29) 阅读(12645) 评论(2) -
我工作的前三年
之前写过我的工作学习经历,大致分为大学,工作前三年,创业六年多,当下。今天想写下我大学毕业工作前三年的经历和感悟,作为程序...6年前 (2019-07-23) 阅读(57388) 评论(5) -
写爬虫,免不了要研究JavaScript设置cookies的问题
网页端抓数据免不了要跟JavaScript打交道,尤其是JS代码有混淆,对cookie做了手脚。找到cookie生成的地方要费一点时间。那天碰到这...6年前 (2019-07-11) 阅读(14219) 评论(1) -
Python文本处理NLP:分词与词云图
昨晚我们又做了一次技术分享,继续上次技术分享的话题“文本数据的处理”。上次,我们分享了文本处理的方方面面的知识点,比较宏观,...6年前 (2019-07-08) 阅读(10776) 评论(0) -
离开了工作六年的地方
上周五离开了工作六年的地方,更准确的是六年零七个月。我一手从零搭建团队做起来的项目。五味杂陈,难过,不甘,纠结,失望,遗憾...6年前 (2019-07-04) 阅读(11245) 评论(7) -
写爬虫时常见的五种字符串编码特征
今天偷个懒写篇总结性的文章,我们在写爬虫,对网络抓包或逆向一些token参数时常常遇到一长串的字符,看到一长串不知其意义的字符串...6年前 (2019-07-02) 阅读(9105) 评论(0) -
爬虫抓了那么多的数据,该如何处理呢?
上周星期天做了第一次B站直播,有点激动,分享的主题是网页正文抽取和NLP基本知识普及。晒一下直播画面:今天把昨天的直播视频内...6年前 (2019-06-24) 阅读(6397) 评论(0) -
大规模爬虫为什么要管理DNS缓存
10年前学爬虫看的第一个开源爬虫叫Larbin ,一个法国程序员用c++开发的,那时用Larbin简单配置一下,因为它能自动遍历抓取,一天几...6年前 (2019-06-20) 阅读(8388) 评论(0) -
不用写代码的爬虫
今天说一个不用写代码,怎么来抓取数据的方式,这种方式能满足相当部分人群的需求。爬数据通常要用程序写一段网络请求代码来获取网...6年前 (2019-06-17) 阅读(5813) 评论(0) -
技术社区的挣钱之道
有一阵没写挣钱系列文章了,之前一直在写个人利用爬虫和Web技术每个月挣几千块零花钱的方法。今天写个稍微大点的,可以当成一个小事...6年前 (2019-06-13) 阅读(11787) 评论(2) -
大规模异步新闻爬虫的分布式实现
前面我们讲了《大规模异步新闻爬虫的实现思路》,在文章最后提到了把它升级为分布式的思路。今天,我们就来详细实现一下,把它真正...6年前 (2019-06-10) 阅读(10391) 评论(2) -
用Python写了个检测抄袭/文章去重算法
中国人有句话叫“天下文章一大抄”,但是在正规场合下“抄”是要付出代价的,比如考试、写论文是不能抄的,一旦被发现后果相当严重。在...7年前 (2019-06-03) 阅读(12783) 评论(8) -
薅当当图书羊毛的时候来了
每年都盼着各种电商节的到来,盼着图书疯狂打折,好趁此囤积要看的书籍。每年我在纸质书籍和电子书籍上大概要花费1000多元,所以对...7年前 (2019-05-24) 阅读(3698) 评论(0)
