V2EX 首页   注册   登录
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX 提问指南
V2EX  ›  问与答

用 Python 写一个爬虫,爬取视频资源并保存,视频按分类存放在硬盘上,目录创建失败致无法保存

  •  
  •   abusizhishen · 30 天前 · 697 次点击

    部分分类名称含有特殊字符、导致创建目录出错。有什么好用的模块或方法能检测并修正目录吗?

    11 回复  |  直到 2017-12-24 14:16:40 +08:00
        1
    lishunan246   30 天前   ♥ 1
    slugify
        2
    abusizhishen   30 天前
    创建目录之前检测一遍,有特殊字符就替换或者去掉,再去创建目录
        3
    Kilerd   30 天前
    md5(name) 满分答案
        4
    Kilerd   30 天前
    然后用一个 sqlite 数据库记住 名字 => md5 目录的对应关系
        5
    abusizhishen   30 天前 via Android
    @lishunan246 一会看下
        6
    abusizhishen   30 天前 via Android
    @Kilerd 复杂了,我保存在本地,直接浏览的
        7
    lniwn   30 天前 via iPhone
    @abusizhishen 先创建目录,如果失败了再检测并替换非法字符。
        8
    manzhiyong   30 天前
    一般我的目录名都是数字,是附件数据库 id 除以某个数(目录下存放文件数)的值。
        9
    frank611   30 天前 via Android
    ???
        10
    Arnie97   30 天前 via Android
    直接正则替换掉特殊字符不能满足需求?
        11
    abusizhishen   29 天前 via Android
    @Arnie97 如果有模块能提供这个功能更好
    DigitalOcean
    关于   ·   FAQ   ·   API   ·   我们的愿景   ·   广告投放   ·   鸣谢   ·   649 人在线   最高记录 3541   ·  
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.0 · 60ms · UTC 19:52 · PVG 03:52 · LAX 11:52 · JFK 14:52
    ♥ Do have faith in what you're doing.
    沪ICP备16043287号-1