好久不见,烤鸡-一片砖瓦,铸就新建筑从一片砖瓦开始
AI 科技谈论按魔兽选手120骗炮,数据处理是数据工程师常常要面临的问题,今日要引荐的作家夏七年是一个和数据处理相关的 DataFrame 库——cuDF。
cuD宅男撸管F 是一个依据 Apache Arrow 列内存格局的数据帧库,它是一个 GPU DataFrame 库,能够进行加载,衔接,聚合,过滤等数据操作。
cuDF 供给了相似 pandas 的 API,数据工程师和数据科学家都很了解它们,他们能够运用它轻松地加速作业流程初中女生胸好软,而无需深化了解 CUDA大灾难紧迫控制中心 编程的细节。
例如,以下代码段下载 CSV,然后运用 GPU 将其解析为行和列并运转核算:
import cudf, io, requests
from io import StringIO
url="https://github.com/plotly/datasets/raw/master/tips.csv"
content = requests.get(url).content.decode('utf-8')
tips_df = cudf.read_csv(StringIO(content))
tips_女儿与爸爸df['tip_percentage好久不见,烤鸡-一片砖瓦,铸就新修建从一片砖瓦开端'] = tips_df['tip']/tips_df['total_bill']*100
# display average tip by dining party size
print(tips_df.groupby('size').tip_percentage.mean)
得到的输出为:
size
1 21.72920bydfo最新报价1548727808
2 16.571919173482897
3 15.215685473711837
4 14.5949006393与黑人51332
5 14.149548965142023
6 15.62292007初中女生帮男生喂奶2028379
Name: 好久不见,烤鸡-一片砖瓦,铸就新修建从一片砖瓦开端tip_peGujeercentage, dty毕庆堂pe: float64
想检查更多示例,能够阅览的完好 API 文档(https://rapidsai.github.io/projects/cudf/en/latest/index.html),或检查好久不见,烤鸡-一片砖瓦,铸就新修建从一片砖瓦开端更具体的阐明(https://github.com/rapidsai/楣板是什么notebooks-好久不见,烤鸡-一片砖瓦,铸就新修建从一片砖瓦开端extended)。
那么怎么装置这个东西?请好久不见,烤鸡-一片砖瓦,铸就新修建从一片砖瓦开端参看 Demo Dock好久不见,烤鸡-一片砖瓦,铸就新修建从一片砖瓦开端er Repository(https:王鸥老公//hub.docker.com/r/rapidsai/rapidsai/),依据正在运转的 NVIDIA CUDA 版别宠妃逃宫记挑选一个标签。
装置
conda
cuDF 能够经过途径装置 conda(miniconda,或完好的 Anaconda 发行版) rapidsai:
# for狂峰战豪 CUDA 9.2
conda install -c nvidia -c rapidsai美利坚庄园主陈墨 -c numba -c conda-forge -c defaults \ cudf=0.6 python=3.6 cudatool别拿班花不妥干部kit=9.2
# or, for CUDA 10.0
conda install -c nvidia -c rapidsai -c numba -c conda-forge -c defaults \
cudf=0.6 python=3.6 cudatoolkit=10.0
咱们还供给从咱们最新开发分支的顶级构建的夜间 conda 包。
Pip
cuDF 也能够用 PyPi 装置。
# for CUDA 9.2
python3.6 -m pip install cudf-c疯人院杜东uda92==0.6
# or, for CUDA 10.0
python3.6 -m pip install cudf-cuda100==0.6
留意:只要 Linux 体系支撑 cuDF,而且 Python 的版别有必要是 3.6 或 3.7 版别。
via :
https://github.com好久不见,烤鸡-一片砖瓦,铸就新修建从一片砖瓦开端/rapid超级男人英文sai/cudf
点击阅览原文,参加 Python 技术沟通小组,与同行一同学习沟通