首页   注册   登录

binux

唉!!
V2EX 第 8105 号会员,加入于 2011-04-20 11:28:13 +08:00
今日活跃度排名 23
安卓手机访问 V2EX 经常 被 Google 广告跳转钓鱼网站
V2EX  •  binux  •  260 天前  •  最后回复来自 gateswong
11
cat *.mp4 | WebTorrent | ABPlayerHTML5 | 野狗实时云 > webtorrent-share
  •  10   
    分享创造  •  binux  •  2016-05-13 12:51:06 PM  •  最后回复来自 jabbany
    28
    member 页面链接指向错误
    反馈  •  binux  •  2015-04-30 00:26:25 AM  •  最后回复来自 Livid
    1
    再次分享 pyspider 爬虫框架
  •  21   
    分享创造  •  binux  •  2016-04-29 23:31:38 PM  •  最后回复来自 explist
    95
    也来一发,豆瓣害羞组读图版
  •  4   
    分享创造  •  binux  •  14 天前  •  最后回复来自 zkeeper
    44
    只有一个文件的 HTTP(s) 代理服务器
    分享创造  •  binux  •  2014-08-20 21:46:17 PM  •  最后回复来自 jackton
    8
    每天自动签到 —— 我们不造脚本,我们造框架
  •  26   
    分享创造  •  binux  •  175 天前  •  最后回复来自 sxakly
    217
    开源一个 python 脚本驱动的定向爬虫
  •  6   
    分享创造  •  binux  •  2016-02-16 22:37:31 PM  •  最后回复来自 commoccoom
    55
    Google+博客评论组件
    分享发现  •  binux  •  最后回复来自 caomu
    2
    binux 最近回复了
    为什么不能,使用场景合适就行。不需要考虑 scaling,多爽
    6 小时 18 分钟前
    回复了 IsaacYoung 创建的主题 问与答 有没有好的跨省搬家解决方案?
    我从英国搬家到美国,找了个所谓国际搬家物流,结果转手给发了 DHL
    @xpresslink #90 需不需要不是你说的算的,你自己说的算的那种都是小打小闹的玩具项目,谁关心你这个?
    @xpresslink #88 并不是,你知道下架产品的 URL,你依旧能够匿名访问到产品以前的快照信息。
    搜索引擎以前索引过,你也能搜索到,但是你就是不能从当前的网站中遍历出来。
    @xpresslink 不,用户不需要遍历,例如历史订单,部分页面只在特定用户的历史订单中存在链接。
    @xpresslink 混淆 ID 可以防止遍历,用户不能遍历,爬虫也不能
    Google mongodb redis benchmark
    16 小时 3 分钟前
    回复了 xuanwu 创建的主题 程序员 在代码中推广中文命名对中国开源软件的意义
    LZ 不会是哪个 NGO 雇来搞我们的吧。
    @xpresslink 搜索引擎是从网站上线第一天起就开始爬了,而你不是。
    存储是爬取过程中最不值钱的东西。

    爬虫,包括搜索引擎和定向爬虫,我不敢说全球 top,在国内我是专家级的。
    @xpresslink 用户能通过搜索引擎看到,不代表爬虫也能。首先搜索引擎防爬就好,其次这样爬虫效率就低了,最后你知道用户用的什么关键词吗?
    你不知道 ID 覆盖率就不全,懂了吗。
    关于   ·   FAQ   ·   API   ·   我们的愿景   ·   广告投放   ·   感谢   ·   实用小工具   ·   2493 人在线   最高记录 4019   ·  
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.1 · 18ms · UTC 12:38 · PVG 20:38 · LAX 04:38 · JFK 07:38
    ♥ Do have faith in what you're doing.
    沪ICP备16043287号-1