小编Møn*_*ter的帖子

给定比率随机分配文件到训练/测试

我正在尝试制作一个安装脚本,能够为我设置一个工作区,这样我就不需要手动完成了.我开始在bash中这样做,但很快就意识到这样做不会那么好.

我的下一个想法是使用python来做,但似乎无法以正确的方式做到这一点.我的想法是创建一个列表(列表是一个带有所有数据文件路径的.txt文件),随机播放此列表,然后将每个文件移动到我的火车目录或测试目录,给定比率....

但这是python,并没有更简单的方法来实现它,似乎我正在做一个ullsary解决方法只是为了分割文件.

Bash代码:

# Partition data randomly into train and test. 
cd ${PATH_TO_DATASET}
SPLIT=0.5 #train/test split
NUMBER_OF_FILES=$(ls ${PATH_TO_DATASET} |  wc -l) ## number of directories in the dataset
even=1
echo ${NUMBER_OF_FILES}

if [ `echo "${NUMBER_OF_FILES} % 2" | bc` -eq 0 ]
then    
        even=1
        echo "Even is true"
else
        even=0
        echo "Even is false"
fi

echo -e "${BLUE}Seperating files in to train and test set!${NC}"

for ((i=1; i<=${NUMBER_OF_FILES}; i++))
do
    ran=$(python -c "import random;print(random.uniform(0.0, 1.0))")    
    if [[ ${ran} < …
Run Code Online (Sandbox Code Playgroud)

python bash file-handling text-files train-test-split

4
推荐指数
1
解决办法
5118
查看次数