Kaggle使用教程
kaggle简介:
Kaggle是一个全球领先的数据科学与机器学习竞赛平台,提供丰富的公开数据集、挑战赛以及学习资源。用户可以通过参与比赛、共享代码和数据集,提升数据分析、机器学习等技能,并与全球的数据科学家、工程师们交流合作。Kaggle还提供了基于Jupyter Notebook的在线编程环境,方便用户快速测试和分享代码,使其成为学习和实践数据科学的理想平台。
kaggle网址:https://www.kaggle.com/
1、注册kaggle
1.1 打开kaggle网站,点击右上角“register”

1.2 点击“register with email”

1.3 输入邮箱,密码,姓名,然后进行人机身份验证,然后点击“next”

由于captcha无法访问,所以无法进行人机身份验证,解决办法如下:
打开Microsoft Edge 加载项商店,搜索:header editor

安装完成后,在扩展模块进行点击:(网页右上角)
点击:
按如下步骤进行:(https://azurezeng.github.io/static/HE-GoogleRedirect.json)
最后再去刷新kaggle注册页面就有人机验证了:
1.4 打开电子邮件,会收到kaggle发送的验证码
对电子邮件地址进行验证即完成kaggle注册
2、如何使用kaggle中的数据集
2.1 点击kaggle左侧datasets

2.2 搜索想要使用的数据集

2.3 打开该数据集,并在该数据集上创建notebook

2.4 在notebook中使用该数据集
在notebook中可以看到,此notebook包含这个数据集

2.5 运行kaggle中包含的初始代码,即可查看这个数据集包含的文件


这样就可以在notebook的代码中使用数据集中的数据了。
3 将计算加速设置为GPU加速
kaggle为免费用户提供每周30小时的GPU加速时间,非常适合进行深度学习的模型训练。
点击右侧“Session options”下方的“Accelerator”,其中None为无加速,使用CPU计算;T4 x2为使用两张英伟达Tesla T4加速,P100为使用英伟达Tesla P100加速,TPU"Tensor Processing Unit"为张量处理单元,通常速度更快,但需要代码对TPU进行优化,推荐使用T4 x2进行加速。
