<?xml version="1.0" encoding="utf-8" standalone="yes"?><rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom"><channel><title>Datascience on Sawyer Zheng's Blog</title><link>https://elated-raman-42e0c2.netlify.app/tags/datascience/</link><description>Recent content in Datascience on Sawyer Zheng's Blog</description><generator>Hugo</generator><language>zh-cn</language><lastBuildDate>Fri, 05 Jan 2024 11:37:47 +0800</lastBuildDate><atom:link href="https://elated-raman-42e0c2.netlify.app/tags/datascience/index.xml" rel="self" type="application/rss+xml"/><item><title>Polars</title><link>https://elated-raman-42e0c2.netlify.app/post/notes/python/polars/</link><pubDate>Sun, 08 Jan 2023 00:00:00 +0000</pubDate><guid>https://elated-raman-42e0c2.netlify.app/post/notes/python/polars/</guid><description>&lt;div id="outline-container-headline-1" class="outline-2"&gt;
&lt;h2 id="headline-1"&gt;
教程
&lt;/h2&gt;
&lt;div id="outline-text-headline-1" class="outline-text-2"&gt;
&lt;ul&gt;
&lt;li&gt;
&lt;p&gt;官方 Get Started&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;&lt;a href="https://pola-rs.github.io/polars-book/user-guide/introduction.html"&gt;Introduction - Polars - User Guide&lt;/a&gt;&lt;/li&gt;
&lt;/ul&gt;
&lt;/li&gt;
&lt;/ul&gt;
&lt;/div&gt;
&lt;/div&gt;
&lt;div id="outline-container-headline-2" class="outline-2"&gt;
&lt;h2 id="headline-2"&gt;
polar expression
&lt;/h2&gt;
&lt;div id="outline-text-headline-2" class="outline-text-2"&gt;
&lt;div id="outline-container-headline-3" class="outline-3"&gt;
&lt;h3 id="headline-3"&gt;
polar.all() vs. Expr.all() 两者作用不同
&lt;/h3&gt;
&lt;div id="outline-text-headline-3" class="outline-text-3"&gt;
&lt;ol&gt;
&lt;li&gt;polar.all(): 选择所有列&lt;/li&gt;
&lt;li&gt;Expr.all(): expression 的一个方法，逻辑判断全为 true, 类似 python 内建函数 all&lt;/li&gt;
&lt;/ol&gt;
&lt;/div&gt;
&lt;/div&gt;
&lt;div id="outline-container-headline-4" class="outline-3"&gt;
&lt;h3 id="headline-4"&gt;
polar.flatten() 类似 pd.Series.explode()
&lt;/h3&gt;
&lt;div id="outline-text-headline-4" class="outline-text-3"&gt;
&lt;p&gt;作用：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;拆分单元格中的列表元素到不同的新行&lt;/li&gt;
&lt;/ul&gt;
&lt;/div&gt;
&lt;/div&gt;
&lt;/div&gt;
&lt;/div&gt;
&lt;div id="outline-container-headline-5" class="outline-2"&gt;
&lt;h2 id="headline-5"&gt;
polar namespace 概念
&lt;/h2&gt;
&lt;div id="outline-text-headline-5" class="outline-text-2"&gt;
&lt;p&gt;类别：&lt;/p&gt;</description></item><item><title>Pandas ---- Big Data Manipulate Tool</title><link>https://elated-raman-42e0c2.netlify.app/post/notes/python/pandas/</link><pubDate>Sat, 20 Apr 2019 00:00:00 +0000</pubDate><guid>https://elated-raman-42e0c2.netlify.app/post/notes/python/pandas/</guid><description>&lt;div id="outline-container-headline-1" class="outline-2"&gt;
&lt;h2 id="headline-1"&gt;
教程
&lt;/h2&gt;
&lt;div id="outline-text-headline-1" class="outline-text-2"&gt;
&lt;ul&gt;
&lt;li&gt;
&lt;p&gt;Pandas Cookbook:&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;&lt;a href="https://github.com/PacktPublishing/Pandas-Cookbook"&gt;https://github.com/PacktPublishing/Pandas-Cookbook&lt;/a&gt;&lt;/li&gt;
&lt;/ul&gt;
&lt;/li&gt;
&lt;li&gt;
&lt;p&gt;Data School&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;&lt;a href="https://www.dataschool.io/best-python-pandas-resources/"&gt;https://www.dataschool.io/best-python-pandas-resources/&lt;/a&gt;&lt;/li&gt;
&lt;/ul&gt;
&lt;/li&gt;
&lt;/ul&gt;
&lt;/div&gt;
&lt;/div&gt;
&lt;div id="outline-container-headline-2" class="outline-2"&gt;
&lt;h2 id="headline-2"&gt;
修改 index
&lt;/h2&gt;
&lt;div id="outline-text-headline-2" class="outline-text-2"&gt;
&lt;div id="outline-container-headline-3" class="outline-3"&gt;
&lt;h3 id="headline-3"&gt;
df.set_index 按给定的列名排序，给定的列变成了 index
&lt;/h3&gt;
&lt;/div&gt;
&lt;div id="outline-container-headline-4" class="outline-3"&gt;
&lt;h3 id="headline-4"&gt;
df.reindex 重新排序 index，添加新 index（同级，不是 MultiIndex）
&lt;/h3&gt;
&lt;div id="outline-text-headline-4" class="outline-text-3"&gt;
&lt;ul&gt;
&lt;li&gt;原形：pd.DataFrame.reindex([&amp;#39;the&amp;#39;, &amp;#39;new&amp;#39;, &amp;#39;labels&amp;#39;], axis=&amp;#39;columns&amp;#39;)&lt;/li&gt;
&lt;li&gt;
&lt;p&gt;注意：&lt;/p&gt;</description></item></channel></rss>