download:百度网盘
其实,不只是iPad,手机也能够。
640?wx_fmt=jpeg (由于微信大众号外部链接的约束,文中的部分链接或许无法正确翻开。如有需求,请点击文末的“阅览原文”按钮,拜访能够正常显现外链的版别。)
痛点 我安排过几回线下编程工作坊,带着同学们用Python处理数据科学问题。
其间最让人头疼的,便是运转环境的装置。
640?wx_fmt=png 脚踏实地地讲,参与工作坊之前,我现已做了认真预备。
例如集成环境,选用了对用户很友爱的Anaconda。
代码在我的Macbook电脑上跑,没有问题。还拿到学生的Windows 7上跑,也没有问题。这才上传到了Github。
在发布的教程文章里,我也现已把装置软件包的阐明写得十分具体。
640?wx_fmt=png 还针对 Anaconda 这一 Python 运转环境的装置和运转,专门录制了视频。
640?wx_fmt=png 可是,工作坊现场遇见的问题,依然形形色色。
有的是操作系统。例如你或许用Windows 10。实话实说,我确实没用过。拿着Surface端详,连装置后的Anaconda文件夹都找不到在哪儿。
有的是编码。不同操作系统,有的默认中文编码是UTF-8,有的是GBK。相同一段中文文本,我这儿显现一切正常,你那里便是乱码。
有的是套件路径。来参与工作坊前,你或许看过我一些教程,并装置了 Python 2.7 版别 Anaconda。来到现场,一看需求 Python 3.6 版别,你就又装置了一份新的。成果履行起来,你底子分不清运转的 Python, pip 指令来自哪一个套件,更搞不清楚软件包究竟装置到哪里去了。再加上虚拟环境装备,你就要抓狂了。
还有的,甚至是网络拥塞问题。由于有时需求现场装置调用体积庞大的软件包,几十台电脑“预备——齐”一同争抢有限的Wifi带宽,后果可想而知。
痛定思痛,我决议改动一下现状。
现在的教程只供给根底源代码。对于许多新手同学来说,是不够的。
许多同学,就倒在了装置依靠软件包的路上,继而干脆放弃了。
变通的办法有许多。例如干脆录制代码履行视频给你看。
可是正如我在《MOOC教育,什么最重要?》一文中说过的,学习过程里,反馈最重要。
你需求能运转代码,而且第一时间取得成果反馈。
在此根底上,你还得能修正代码,比照前后履行成果的不同。
我得给你供给一个直接能够运转的环境。
零装置,自然也就没了上述烦恼。
这个事儿或许吗?
我研究了一下,没问题。
只需你的设备上有个现代化浏览器(包括但不限于Google Chrome, Firefox, Safari和Microsoft Edge等)就行。
IE 8.0?
那个不可,赶紧晋级吧!
读到这儿,你应该想明白了。由于只挑浏览器,不挑操作系统,所以别说你用Windows 10,你便是用iPad,都能运转代码。
测验 请你翻开浏览器,输入这个链接(http://t.cn/R35fElv)。
看看会发生什么?
我这儿用iPad给你演示。
一开始会有个发动界面出来。请你稍等10几秒钟。
640?wx_fmt=jpeg 然后,你就能看到熟悉的Python代码运转界面了。
640?wx_fmt=jpeg 这个界面来自 Jupyter Lab。
你能够将它理解为 Jupyter Notebook 的增强版,它具备以下特征:
代码单元直接鼠标拖动;
一个浏览器标签,可翻开多个Notebook,而且分别运用不同的Kernel;
供给实时烘托的Markdown编辑器;
完整的文件浏览器;
CSV数据文件快速浏览
……
图中左侧分栏,是工作目录下的悉数文件。
右侧翻开的,是咱们要运用的ipynb文件。
为了证明这不是逗你玩儿,请你点击右侧代码上方东西栏的运转按钮。
点击一下,就会运转出当前地点代码单元的成果。
不断点击下来,你能够看见,成果都被正常烘托。
640?wx_fmt=jpeg 连图像也能正常显现。
640?wx_fmt=jpeg 甚至连下面这种需求必定运算量的可视化成果,都没问题。
640?wx_fmt=jpeg 为了证明这不是变魔术,你能够在新的单元格,写一行输出句子。
就让Python输出你的名字吧。
假如你叫 Chuck,就这样写:
print("Hello, Chuck!") 把它替换成你自己的姓名,看看输出成果是否正确?
640?wx_fmt=jpeg 其实,又何止是iPad而已?
你假如足够勇(sang) 于(xin) 尝(bing) 试(kuang),手机其实也是能够的。
就像这样。
640?wx_fmt=jpeg 流程 下面我给你讲讲,这种作用是怎样做出来的。
咱们需求用到一款东西,叫做 mybinder 。它能够协助咱们,把 github 上的某个代码仓库(repo),快速转化成为一个可运转的环境。
注意 mybinder 为咱们供给了云设施,也便是计算资源和存储资源。因而即便许许多多的用户同时在线运用同一份代码转化出来的环境,也不会互相冲突。
咱们先来看看,怎样预备一个可供 mybinder 顺利转化的代码仓库。
我为你供给的样例在这儿(http://t.cn/R35MEqk):
640?wx_fmt=png 顺便说一句,这个样例来自于我的数据科学系列教程之《如何用Python处理自然语言?(Spacy与Word Embedding)》。感兴趣的同学能够点击链接,检查原文。
在该 GitHub 页面展现的文件列表中,你需求注意以下3个文件:
demo.ipynb
environment.yml
postBuild
其间demo.ipynb便是你在上一节看到的包括源代码的Jupyter Notebook文件。你需求首先在本地装置相关软件包,而且运转测试通过。
假如在你本地运转都有错误,放到云上去,想必也难以正常运转。
environment.yml文件十分重要,它来告知 mybinder ,需求如何为你的代码运转预备环境。
咱们翻开看看该文件的内容:
dependencies: - python=3 - pip: - spacy - ipykernel - scipy - numpy - scikit-learn - matplotlib - pandas - thinc 这个文件首先告知 mybinder ,你的 Python 版别。咱们选用的是 3.6 版。所以只需求指定 python=3 即可。mybinder 会主动为你下载装置最新的。
然后这个文件阐明需求运用 pip 东西装置哪些软件包。咱们需求把一切依靠的装置包都罗列出来。
这便是之前,我总在教程里给你阐明的那些预备过程。
可是这还没有完,由于 mybinder 只是为你装置好了一些软件依靠。
这儿还有两个过程需求处理:
为了剖析语义,咱们需求调用预训练的Word2vec模型,这需求 mybinder 为咱们提前下载好。
Jupyter Notebook 翻开后,应当运用的 kernel 名称为 wangshuyi ,这个 kernel 现在还没有在 Jupyter 里边注册。咱们需求 mybinder 代庖。
为了完成上述两个过程,你就需求预备最终一个postBuild文件。
它的内容如下:
python -m spacy download en python -m spacy download en_core_web_lg python -m ipykernel install --user --name=wangshuyi 跟它的名字相同。它是在 mybinder 依据 environment.yml 装置了依靠组成后,依次履行的指令。假如你的代码需求其他的指令供给环境支持,也能够放在这儿。
至此,你的预备工作就算结束了。
魔法表演正式开始。
请翻开 mybinder 的网址(https://mybinder.org/)。
640?wx_fmt=png 在 “GitHub repo or URL” 一栏,填写咱们的 github 代码仓库链接,即:
https://github测试数据/wshuyi/demo-spacy-text-processing 咱们希望一进入界面,就主动翻开 demo.ipynb ,因而需求在“Path to a notebook file (optional)”一栏填写demo.ipynb 。
这时,你会发现“Copy the URL below and share your Binder with others:”一栏中,呈现了你的代码运转环境网址。
https://mybinder.org/v2/gh/wshuyi/demo-spacy-text-processing/master?filepath=demo.ipynb 点击右侧的“仿制”按钮保存到你的记事本里边。将来找到你转化好的运转环境,就全赖它了。
妥善保存地址后,点击“Launch”按钮。
640?wx_fmt=png 根据你的依靠装置包数量等因素,你需求等待的时间长短不一。可是只有第一次构建的时分,需求花一些时间。
今后每一次调用履行,就都会十分快了。
构建结束后, mybinder 会主动为咱们开启对应的运转环境。
640?wx_fmt=png 很有成就感吧!
测试一下,能够正常运转代码,就证明咱们成功了。
可是你会发现,不对啊!
老师你方才用 iPad 展现的,不是高档版的 Jupyter Lab 吗?怎样又变成了 Jupyter Notebook 了?
我也想要高档版!
别着急。
查看更多关于MK 首门程序员理财课 Python量化交易系统实战 网盘的详细内容...