以/learn/THU0201Kc001158/THU0201Kc001158/16905510/video/36120287
(资料图片仅供参考)
这个课程为例。
加入课程后,我们随便打开一节视频,可以看到是有字幕的
右键空白处,点最后一个“检查”,选择“网络”这一页,然后我们刷新一下网页。
刷新完后,在“网络”这个页面按ctrl+F打开“搜索”,在方框内输入“/api/v1/lms/service/”,点一下旁边的刷新键,下面会出现几个项,需要注意的是带有“playurl”和“subtitle_parse”这两项。
我们先看playurl的这个,点一下它,将右边的“请求URL”后面的链接复制到地址栏打开,可以看到一个界面,里面有两个链接,即为本视频的视频文件。quality值越大的对应链接的视频更清晰。
我们接着看subtitle_parse这一项,还是打开“请求URL”后面的链接,可以看到内容包括两个,一个是"start",一个是"text"。前者对应的这些数值应该与时间有关,标明了字幕出现的时间,但是这个加密的方式未知,所以不知道怎么把它转为时间刻;后者即为Unicode编码的字幕,转换一下可以发现就是视频的字幕。如果能够找到方法能够找到转换时间的方法,那么结合后面的字幕文本,利用js和python应该可以批量化操作,下载字幕。
参考链接:
/xuanyu-10-18/p/
/xuanyu-10-18/p/
(里面提供的脚本也许改改还能用,但是我不会)
关键词: