- 关于Geotrellis
Geotrellis是一款基于分布式存储和计算的栅格数据处理框架。
- 使用环境说明
1、Python
Geotrellis是基于Scala语言编程实现的,同时Geotrellis也提供了其他编程语言如Python、R语言的开发接口。由于项目的需要,这里使用Python语言,版本选择3.7.3,编译器选择pycharm2019.1。具体的安装和部署过程参见其他教程。
2、Spark
Geotrellis使用分布式计算,所以需要安装Sprak。具体的安装步骤可以参考其他教程,这里不再说明。
Spark环境部署完成后,可以通过spark-submit的方式提交python代码。Python使用spark需要引入spark提供的PySpark包,安装方式:
1)使用pip
pip install pyspark
下载的使用需要指定版本,最好和安装的spark版本一致。比如:pip install pyspark==2.2.0
2)直接下载压缩包,地址:https://pypi.org/project/pyspark/#files
下载后使用pip install 目录\pyspark-2.4.3.tar.gz
我使用的spark版本是2.2.0
3、GeopySpark
Python需要引入Geotrellis提供的Pytho包,下载方式同pyspark。
如:pip install geopyspark=0.2.0
下载完成后需要生成jar包
Geopyspark install -jar
Python的代码最终会调用这些jar包,如下:
说明部署完成。注意geopyspark的版本。
我这里使用的geopyspark版本是0.2.0
至此,基本环境已经部署完成,可以尝试开发了。