2020-06-19 15:51:09 +08:00
2020-04-03 17:33:00 +08:00
2020-05-04 12:20:45 +08:00
2019-11-04 08:18:09 +08:00
2020-04-19 19:42:19 +09:00
2020-04-01 02:30:00 +08:00
2020-06-19 15:51:09 +08:00
2020-06-14 22:54:52 +08:00
2020-06-19 15:51:09 +08:00
2020-06-19 15:51:09 +08:00
2020-06-19 15:51:09 +08:00
2020-06-14 22:54:52 +08:00
2020-04-18 19:34:28 -07:00
2020-03-25 19:30:59 +09:00
2020-04-11 03:06:09 +08:00
2020-04-23 11:11:29 +09:00
2019-10-27 16:28:51 +08:00
2020-03-24 11:08:28 +08:00
2020-04-15 15:15:24 +08:00
2020-06-11 16:48:12 +08:00
2020-04-01 02:30:00 +08:00
2020-05-07 19:46:27 +08:00
2020-06-19 15:51:09 +08:00
2020-06-14 22:54:52 +08:00
2020-04-15 15:15:24 +08:00

AV Data Capture (CLI)

CLI 版本

GUI 版本

日本电影元数据 抓取工具 | 刮削器,配合本地影片管理软件 Emby, Jellyfin, Kodi 等管理本地影片该软件起到分类与元数据metadata抓取作用利用元数据信息来分类供本地影片分类整理使用。

本地电影刮削与整理一体化解决方案

目录

声明

当你运行了本软件,即代表你接受了以下条款

  • 本软件仅供技术交流,学术交流使用
  • 本软件作者编写出该软件旨在学习 Python ,提高编程水平
  • 用户在使用本软件前,请用户了解并遵守当地法律法规,如果本软件使用过程中存在违反当地法律法规的行为,请勿使用该软件
  • 用户在使用本软件时,若用户在当地产生一切违法行为由用户承担
  • 严禁用户将本软件使用于商业和个人其他意图
  • 本软件作者yoshiko2保留最终决定权和最终解释权

若用户不同意上述条款任意一条,请勿使用本软件


When you run the software, you accept the following terms

  • This software is only for technical exchange and academic exchange
  • The software author wrote this software to learn Python and improve programming
  • Before using this software, please understand and abide by local laws and regulations. If there is any violation of local laws and regulations during the use of this software, please do not use this software
  • When the user uses this software, if the user has any illegal acts in the local area, the user shall bear
  • It is strictly forbidden for users to use this software for commercial and personal intentions
  • The author of this software yoshiko2 reserves the right of final decision and final interpretation

If the user does not agree with any of the above terms, please do not use this software

FAQ

软件能下片吗?

  • 本软件不提供任何影片下载地址,仅供本地影片分类整理使用

什么是元数据metadata

  • 元数据包括了影片的封面,导演,演员,简介,类型......

软件收费吗?

  • 本软件永久免费,除了作者yìng点以外

软件运行异常怎么办?

为什么软件要单线程运行?

  • 多线程爬取可能会触发网站反爬机制,同时也违背了些道德,故单线程运行

效果图

图片来自网络,图片仅供参考,具体效果请自行联想 preview_picture_1 preview_picture_2

下载

下载地址

For Advenced User|高级用户|开发者

  • 请clone源码包运行并手动安装Python3环境

如何使用

快速开始:

  1. 下载可执行程序或者源码
  2. 把软件拉到和电影的同一目录(暂不支持绝对路径工作)
  3. 设置 config.ini 文件
  4. 运行软件等待完成
  5. 把 导出文件夹 导入至 Kodi, Emby, Jellyfin, Plex 中。
  6. emby/jellyfin头像上传可使用gfriends

使用 Docker

Docker容器可以方便在在NAS上使用。

  1. 将docker目录中的内容下载下来
  2. 构建镜像 sudo docker-compose build jav
  3. 运行容器 JAVUID=$(id -u) JAVGID=$(id -g) JAV_PATH=<FullPathToLibrary> sudo docker up -d jav
  4. 容器运行结束后会自动退出,处理好的内容会存入<FullPathToLibrary>/organized, 失败的内容会移入<FullPathToLibrary>/failure_output.
  5. 注意目前容器不支持配置代理。所以必须在路由器上配置好透明代理或者在build之前自行修改config.ini的内容。

详细请看以下完整文档

完整文档

模块安装

如果运行源码版,运行前请安装Python环境和安装以下模块

在终端 cmd/Powershell/Terminal 中输入以下代码来安装模块

pip install requests pyquery lxml Beautifulsoup4 pillow

配置config.ini

运行模式

[common]
main_mode=1

1为普通模式
2为整理模式仅根据女优把电影命名为番号并分类到女优名称的文件夹下

success_output_folder=JAV_outputd
failed_output_folder=failed

设置成功输出目录和失败输出目录


软链接

方便PT下载完既想刮削又想继续上传的仓鼠党同志

[common]
soft_link=0

1为开启软链接模式
0为关闭


网络设置

[proxy]  
proxy=127.0.0.1:1081  
timeout=10  
retry=3

针对某些地区的代理设置

proxy=127.0.0.1:1081  

打开config.ini,在[proxy]下的proxy行设置本地代理地址和端口支持Shadowxxxx/X,V2XXX本地代理端口
素人系列抓取建议使用日本代理
路由器拥有自动代理功能的可以把proxy=后面内容去掉
本地代理软件开全局模式的用户同上
如果遇到tineout错误可以把文件的proxy=后面的地址和端口删除,并开启代理软件全局模式,或者重启电脑,代理软件,网卡


连接超时重试设置

timeout=10  

10为超时重试时间 单位:秒


连接重试次数设置

retry=3  

3即为重试次数


检查更新开关

[update]  
update_check=1  

0为关闭1为开启不建议关闭


刮削网站优先级

[priority]
website=javbus,javdb,fanza,xcity,mgstage,fc2,avsox,jav321

,英文逗号分开网站,刮削顺序从左往右


排除指定字符和目录

[escape]  
literals=\  
folders=failed,JAV_output

literals= 标题指定字符删除,例如iterals=\(),则删除标题中\()字符
folders= 指定目录,例如folders=failed,JAV_output多目录刮削时跳过failed,JAV_output


调试模式

[debug_mode]
switch=1  

如要开启调试模式,请手动输入以上代码到config.ini中,开启后可在抓取中显示影片元数据


(可选)设置自定义目录和影片重命名规则

[Name_Rule]
location_rule=actor+'/'+number
naming_rule=number+'-'+title

已有默认配置


命名参数

title = 片名
actor = 演员
studio = 公司
director = 导演
release = 发售日
year = 发行年份
number = 番号
cover = 封面链接
tag = 类型
outline = 简介
runtime = 时长

上面的参数以下都称之为变量

例子:

自定义规则方法:有两种元素,变量和字符,无论是任何一种元素之间连接必须要用加号 + ,比如:'naming_rule=['+number+']-'+title,其中冒号 ' ' 内的文字是字符,没有冒号包含的文字是变量,元素之间连接必须要用加号 +

locaton_rule

该为影片路径规则 目录结构规则:默认 location_rule=actor+'/'+number

不推荐修改时在这里添加 title,有时 title 过长,因为 Windows API 问题,抓取数据时新建文件夹容易出错。

naming_rule

该为媒体库内标题的命名规则规则NFO文件内标题

Description
日本电影元数据抓取工具,配合kodi,emby等本地媒体管理工具使用
Readme GPL-3.0 14 MiB
Languages
Python 98.3%
Shell 0.7%
Makefile 0.4%
PowerShell 0.3%
Dockerfile 0.3%