跳转至

1 环境搭建及使用

学习目标

  • 独立完成开发环境搭建
  • 掌握 Anaconda的使用方法
  • 掌握DataSpell和Jupyter Notebook的使用方法

1 开发环境搭建

1.1 image-20200427181401810简介

  • Anaconda 是最流行的数据分析平台,全球两千多万人在使用
  • Anaconda 附带了一大批常用数据科学包
  • conda
  • Python
  • 150 多个科学包及其依赖项
  • Anaconda 是在 conda(一个包管理器和环境管理器)上发展出来的
  • Conda可以帮助你在计算机上安装和管理数据分析相关包
  • Anaconda的仓库中包含了7000多个数据科学相关的开源库
  • Anaconda 包含了虚拟环境管理工具
  • 通过虚拟环境可以使不同的Python或者开元库的版本同时存在

1.2 Anaconda安装

  • Anaconda 可用于多个平台( Windows、Mac OS X 和 Linux)

  • 可以在官网上下载对应平台的安装包

  • 如果计算机上已经安装了 Python,安装不会对你有任何影响

  • 安装的过程很简单,一路下一步即可

  • 访问https://www.anaconda.com/products/individual,如下图所示点击下载

anaconda下载安装01

  • 根据你的操作系统来选择相应的版本下载

anaconda下载安装01

  • 从Windows中上传安装包到Linux虚拟机

image-20220110183439684

image-20220110183726102

  • 安装anaconda

image-20220110183911843

image-20220110184004986

image-20220110184446424

image-20220110184615129

注意:安装完成之后需要在终端中执行一次source ~/.bashrc或者重新打开一下新的终端,打开新终端不用执行source命令。

虚拟机中已经安装好anaconda,可以直接使用

2 Anaconda的使用

2.1 Anaconda的虚拟环境管理

  • 不同的python项目,可能使用了各自不同的python的包、模块;
  • 不同的python项目,可能使用了相同的python的包、模块,但版本不同;
  • 不同的python项目,甚至使用的Python的版本都是不同;

为了让避免项目所使用的Python及包模块版本冲突,所以需要代码运行的依赖环境彼此分开,业内有各种各样的成熟解决方案,但原理都是一样的:不同项目代码的运行,使用保存在不同路径下的python和各自的包模块;不同位置的python解释器和包模块就称之为虚拟环境,具体关系图如下:

虚拟环境和项目的关系

虚拟环境的本质,就是在你电脑里安装了多个Python解释器(可执行程序),每个Python解释器又关联了很多个包、模块;项目代码在运行时,是使用特定路径下的那个Python解释器来执行

  • 虚拟环境的作用

  • 很多开源库版本升级后API有变化,老版本的代码不能在新版本中运行

  • 将不同Python版本/相同开源库的不同版本隔离
  • 不同版本的代码在不同的虚拟环境中运行

  • 通过命令行创建虚拟环境

格式如下
conda create -n 虚拟环境名字 python=python版本  #创建虚拟环境,开始新项目时执行一次
conda activate 虚拟环境名字 #进入虚拟环境,每次打开终端都需要执行
conda deactivate #退出虚拟环境,一般很少使用
conda remove -n 虚拟环境名字 --all  #删除虚拟环境,一般很少使用
示例
conda create -n test python=3.8
conda activate test
conda deactivate
conda remove -n test --all

image-20220110185114650

image-20220110185233555

2.3 Anaconda的包管理功能

  • 可以通过conda install 安装【不推荐】
conda install 包名字  
  • 可以通过pip install 安装
pip install 包名字
  • 安装其他包速度慢可以指定国内镜像
# 阿里云:https://mirrors.aliyun.com/pypi/simple/
# 豆瓣:https://pypi.douban.com/simple/
# 清华大学:https://pypi.tuna.tsinghua.edu.cn/simple/
# 中国科学技术大学 http://pypi.mirrors.ustc.edu.cn/simple/

pip install 包名 -i https://mirrors.aliyun.com/pypi/simple/  #通过阿里云镜像安装
  • 本阶段需要安装的python包,可以通过以下命令安装
conda activate test #首先激活虚拟环境,必须先激活虚拟环境再安装
pip install pandas matplotlib seaborn jupyter notebook #使用pip安装

3 启动 Jupyter服务

3.1 创建jupyter配置文件目录

  • 创建jupyter配置目录
mkdir .jupyter
cd .jupyter

image-20220110185809846

3.2 将jupyter配置文件上传到虚拟机

image-20220110190029174

image-20220110190115571

3.3 在Linux终端启动 Jupyter服务

  • 启动jupyter
# conda activate test # 根据课程选择相应虚拟环境,也可直接在base环境中运行
jupyter notebook

image-20220110190424437

4 Jupyter Lab使用

4.1 基本使用

在虚拟机启动jupyter notebook后,在宿主机浏览器中输入 http://192.168.88.161:8888/lab 即可进入Jupyter Lab页面。

  • 常用快捷键

  • 两种模式通用快捷键

    • Shift+Enter,执行本单元代码,并跳转到下一单元格
    • Ctrl+Enter,执行本单元代码,留在本单元格
  • 命令模式,按ESC进入

    • Y,cell切换到Code模式
    • M,cell切换到Markdown模式
    • A,在当前cell的上面添加cell
    • B,在当前cell的下面添加cell
    • 双击D:删除当前cell
  • 编辑模式,按Enter进入

    • 多光标操作:Ctrl键点击鼠标
    • 回退:Ctrl+Z
    • 重做:Ctrl+Y
    • 补全代码:变量、方法后跟Tab键
    • 为一行或多行代码添加/取消注释:Ctrl+/

4.2 使用Markdown

  • 在命令模式中,按M即可进入到Markdown编辑模式

  • 使用Markdown语法可以在代码间穿插格式化的文本作为说明文字或笔记

  • Markdown语法简介

# 表示一级标题 

## 表示二级标题

- 减号后面加空格,表示无序列表

1. 表示有序列表

``` 输入代码

> 引用

总结

  • 独立完成开发环境搭建
  • 安装Anaconda作为开发环境的管理器
  • 掌握 Anaconda 的使用方法
  • Anaconda可以管理虚拟环境
  • Anaconda可以管理虚拟环境中的软件包
  • 掌握Jupyter Lab的使用方法
  • 扩展名为.ipynb
  • 在cell中编辑代码和展示输出结果
  • 支持Markdown语法