# MacOS 系统下载方式 #!/bin/bash # 设置环境变量 export HF_ENDPOINT=https://hf-mirror.com # dataset dir 下载到本地目录 dataset_dir="your local dataset dir" # 下载预训练数据集 modelscope download --dataset ddzhu123/seq-monkey mobvoi_seq_monkey_general_open_corpus.jsonl.tar.bz2 --local_dir ${dataset_dir} # 解压预训练数据集 tar -xvf "${dataset_dir}/mobvoi_seq_monkey_general_open_corpus.jsonl.tar.bz2" -C "${dataset_dir}" # 下载SFT数据集 huggingface-cli download \ --repo-type dataset \ --resume-download \ BelleGroup/train_3.5M_CN \ --local-dir "${dataset_dir}/BelleGroup" # Windows下载方式 # 使用PowerShell下载 # 暂时为当前PowerShell界面设置环境,关闭Powershell环境自动消失 $env:HF_ENDPOINT = "https://hf-mirror.com" # 将\path\to\your\dataset替换成想要下载dataset目录地址 $dataset_dir = "\path\to\your\dataset" # 需要预先安装modelscope,使用pip install modelscope安装 modelscope download --dataset ddzhu123/seq-monkey mobvoi_seq_monkey_general_open_corpus.jsonl.tar.bz2 --local_dir "$dataset_dir" tar -xvf "$dataset_dir\mobvoi_seq_monkey_general_open_corpus.jsonl.tar.bz2" -C "$dataset_dir" huggingface-cli download ` --repo-type dataset ` --resume-download ` BelleGroup/train_3.5M_CN ` --local-dir "$dataset_dir\BelleGroup" # 使用CMD下载 # 暂时为当前CMD界面设置环境,关闭CMD环境自动消失 set HF_ENDPOINT=https://hf-mirror.com # 将\path\to\your\dataset替换成想要下载dataset目录地址 set dataset_dir=\path\to\your\dataset modelscope download --dataset ddzhu123/seq-monkey mobvoi_seq_monkey_general_open_corpus.jsonl.tar.bz2 --local_dir %dataset_dir% tar -xvf "%dataset_dir%\mobvoi_seq_monkey_general_open_corpus.jsonl.tar.bz2" -C "%dataset_dir%" huggingface-cli download ^ --repo-type dataset ^ --resume-download ^ BelleGroup/train_3.5M_CN ^ --local-dir "%dataset_dir%\BelleGroup"