1 环境搭建及使用¶
学习目标¶
- 独立完成开发环境搭建
- 掌握 Anaconda的使用方法
- 掌握DataSpell和Jupyter Notebook的使用方法
1 开发环境搭建¶
1.1 简介¶
- Anaconda 是最流行的数据分析平台,全球两千多万人在使用
- Anaconda 附带了一大批常用数据科学包
- conda
- Python
- 150 多个科学包及其依赖项
- Anaconda 是在 conda(一个包管理器和环境管理器)上发展出来的
- Conda可以帮助你在计算机上安装和管理数据分析相关包
- Anaconda的仓库中包含了7000多个数据科学相关的开源库
- Anaconda 包含了虚拟环境管理工具
- 通过虚拟环境可以使不同的Python或者开元库的版本同时存在
1.2 Anaconda安装¶
-
Anaconda 可用于多个平台( Windows、Mac OS X 和 Linux)
-
可以在官网上下载对应平台的安装包
-
如果计算机上已经安装了 Python,安装不会对你有任何影响
-
安装的过程很简单,一路下一步即可
-
访问https://www.anaconda.com/products/individual,如下图所示点击下载
- 根据你的操作系统来选择相应的版本下载
- 从Windows中上传安装包到Linux虚拟机
- 安装anaconda
注意:安装完成之后需要在终端中执行一次source ~/.bashrc
或者重新打开一下新的终端,打开新终端不用执行source命令。
虚拟机中已经安装好anaconda,可以直接使用
2 Anaconda的使用¶
2.1 Anaconda的虚拟环境管理¶
- 不同的python项目,可能使用了各自不同的python的包、模块;
- 不同的python项目,可能使用了相同的python的包、模块,但版本不同;
- 不同的python项目,甚至使用的Python的版本都是不同;
为了让避免项目所使用的Python及包模块版本冲突,所以需要代码运行的依赖环境彼此分开,业内有各种各样的成熟解决方案,但原理都是一样的:不同项目代码的运行,使用保存在不同路径下的python和各自的包模块;不同位置的python解释器和包模块就称之为虚拟环境,具体关系图如下:
虚拟环境的本质,就是在你电脑里安装了多个Python解释器(可执行程序),每个Python解释器又关联了很多个包、模块;项目代码在运行时,是使用特定路径下的那个Python解释器来执行
-
虚拟环境的作用
-
很多开源库版本升级后API有变化,老版本的代码不能在新版本中运行
- 将不同Python版本/相同开源库的不同版本隔离
-
不同版本的代码在不同的虚拟环境中运行
-
通过命令行创建虚拟环境
格式如下
conda create -n 虚拟环境名字 python=python版本 #创建虚拟环境,开始新项目时执行一次
conda activate 虚拟环境名字 #进入虚拟环境,每次打开终端都需要执行
conda deactivate #退出虚拟环境,一般很少使用
conda remove -n 虚拟环境名字 --all #删除虚拟环境,一般很少使用
示例
conda create -n test python=3.8
conda activate test
conda deactivate
conda remove -n test --all
2.3 Anaconda的包管理功能¶
- 可以通过conda install 安装【不推荐】
conda install 包名字
- 可以通过pip install 安装
pip install 包名字
- 安装其他包速度慢可以指定国内镜像
# 阿里云:https://mirrors.aliyun.com/pypi/simple/
# 豆瓣:https://pypi.douban.com/simple/
# 清华大学:https://pypi.tuna.tsinghua.edu.cn/simple/
# 中国科学技术大学 http://pypi.mirrors.ustc.edu.cn/simple/
pip install 包名 -i https://mirrors.aliyun.com/pypi/simple/ #通过阿里云镜像安装
- 本阶段需要安装的python包,可以通过以下命令安装
conda activate test #首先激活虚拟环境,必须先激活虚拟环境再安装
pip install pandas matplotlib seaborn jupyter notebook #使用pip安装
3 启动 Jupyter服务¶
3.1 创建jupyter配置文件目录¶
- 创建jupyter配置目录
mkdir .jupyter
cd .jupyter
3.2 将jupyter配置文件上传到虚拟机¶
3.3 在Linux终端启动 Jupyter服务¶
- 启动jupyter
# conda activate test # 根据课程选择相应虚拟环境,也可直接在base环境中运行
jupyter notebook
4 Jupyter Lab使用¶
4.1 基本使用¶
在虚拟机启动jupyter notebook
后,在宿主机浏览器中输入 http://192.168.88.161:8888/lab 即可进入Jupyter Lab页面。
-
常用快捷键
-
两种模式通用快捷键
Shift+Enter
,执行本单元代码,并跳转到下一单元格Ctrl+Enter
,执行本单元代码,留在本单元格
-
命令模式,按ESC进入
Y
,cell切换到Code模式M
,cell切换到Markdown模式A
,在当前cell的上面添加cellB
,在当前cell的下面添加cell双击D
:删除当前cell
-
编辑模式,按Enter进入
- 多光标操作:
Ctrl键点击鼠标
- 回退:
Ctrl+Z
- 重做:
Ctrl+Y
- 补全代码:变量、方法后跟
Tab键
- 为一行或多行代码添加/取消注释:
Ctrl+/
- 多光标操作:
4.2 使用Markdown¶
-
在命令模式中,按M即可进入到Markdown编辑模式
-
使用Markdown语法可以在代码间穿插格式化的文本作为说明文字或笔记
-
Markdown语法简介
# 表示一级标题
## 表示二级标题
- 减号后面加空格,表示无序列表
1. 表示有序列表
``` 输入代码
> 引用
总结¶
- 独立完成开发环境搭建
- 安装Anaconda作为开发环境的管理器
- 掌握 Anaconda 的使用方法
- Anaconda可以管理虚拟环境
- Anaconda可以管理虚拟环境中的软件包
- 掌握Jupyter Lab的使用方法
- 扩展名为.ipynb
- 在cell中编辑代码和展示输出结果
- 支持Markdown语法