Spatio-temporal data managment of satellite imagery

Main Article Content

Matías Alejandro Castillo Moine
Mónica Graciela Balzarini

Abstract

The management of long time series data of Normalized Difference Vegetation Index (NDVI) over large territories demands efficient use of computational resources. This paper discusses and illustrates strategies for the construction and statistical processing of massive spatio-temporal databases from satellite images. The implementation of a data management protocol in the R software is detailed, with implementation of parallel computations. The results show that the concept divide-apply-combine was adequate to filter and classify long time series of NDVI territorially distributed at a regional scale.

Article Details

How to Cite
Spatio-temporal data managment of satellite imagery . (2019). AgriScientia, 36(2), 67-80. https://doi.org/10.31047/1668.298x.v36.n2.23410
Section
Short comunications
Author Biographies

Matías Alejandro Castillo Moine, Universidad de Buenos Aires, Consejo Nacional de Investigaciones Científicas y Técnicas, Instituto de Investigaciones Fisiológicas y Ecológicas Vinculadas a la Agricultura (IFEVA), Facultad de Agronomía.

Becario doctoral CONICET

Mónica Graciela Balzarini, Universidad Nacional de Córdoba, Consejo Nacional de Investigaciones Científicas y Técnicas, Cátedra de Estadística y Biometría, Facultad de Ciencias Agropecuarias.

Investigadora CONICET. 

Profesora en la FCA-UNC

How to Cite

Spatio-temporal data managment of satellite imagery . (2019). AgriScientia, 36(2), 67-80. https://doi.org/10.31047/1668.298x.v36.n2.23410

References

Adler, D., Gläser, C., Nenadic, J., Oehlschlägel, J. y Zucchini, W. (2018). ff: Memory-efficient Storage of Large Data on Disk and Fast Access Functions (versión 2.2-14) [Software de cómputo]. Viena, Austria: The Comprehensive R Archive Network: Contributed Packages.

Bivand, R., Keitt, T. y Rowlingson, B. (2014). rgdal: Bindings for the Geospatial Data Abstraction Library(versión 0.9-1) [Software de cómputo]. Viena, Austria: The Comprehensive R Archive Network: Contributed Packages.

Busetto, L. y Ranghetti, L. (2016). MODIStsp: An R package for automatic preprocessing of MODIS Land Products time series. Computers & Geosciences, 97, 40-48. https://doi.org/http://dx.doi.org/10.1016/j.cageo.2016.08.020

Butler, H., Daly, M., Doyle, A., Gillies, S., Hagen, S. y Schaub, T. (2016). The GeoJSON Format. En Internet Engineering Task Force (IETF). https://doi.org/10.17487/RFC7946

Calaway, R., Microsoft Corporation, Weston, S. y Tenenbaum, D. (2018). Foreach Parallel Adaptor for the «parallel» Package (versión 1.4.7) [Software de cómputo]. Viena, Austria: The Comprehensive R Archive Network: Contributed Packages.

Cao, R., Chen, Y., Shen, M., Chen, J., Zhou, J., Wang, C. y Yang, W. (2018). A simple method to improve the quality of NDVI time-series data by integrating spatiotemporal information with the Savitzky-Golay filter. Remote Sensing of Environment, 217, 244-257. https://doi.org/10.1016/J.RSE.2018.08.022

Capitanelli, R. G. (1979). Geomorfología. En R. A. Miatello, M. E. Roque y J. B. Vázquez (Eds.), Geografía física de la provincia de Córdoba (213-296). Córdoba, Argentina: Boldt.

Cochran, W. G. (1977). Sampling Techniques(3aed.). Nueva York, Estados Unidos: Wiley.

Congalton, R. G. (2015). Assessing positional and thematic accuracies of maps generated from remotely sensed data. En Prasad Thenkabail (Ed.), Remote Sensing Handbook-Three Volume Set (pp. 617-636). CRC Press. https://doi.org/10.1201/b19294

Developers, S. (2013). signal: Signal processing (versión 0.7-6) [Software de cómputo]. Viena, Austria: The Comprehensive R Archive Network: Contributed Packages.

Folk, M., Heber, G., Koziol, Q., Pourmal, E. y Robinson, D. (2011). An overview of the HDF5 technology suite and its applications. Proceedings of the EDBT/ICDT 2011 Workshop on Array Databases - AD ’11. https://doi.org/10.1145/1966895.1966900

García, C., Piumetto, M., Teich, I., Morales, H., Kindgard, A., Fuentes, M.… Ravelo, A. (2018). Mapas de cobertura del suelo de la provincia de Córdoba 2017/2018 - niveles 1 a 3. Recuperado de https://idecor-ws.cba.gov.ar/geoserver/idecor/wms

GDAL/OGR Contributors. (2018). GDAL - Geospatial Data Abstraction Library (versión 2.1) [Software de cómputo]. Recuperado de https://gdal.org

Ghetta, M. y QGIS Development Team. (2018). R Processing Scripts Module. QGIS Geographic Information System (versión 1) [Software de cómputo]. Recuperado de http://www.qgis.org/

Gorgas, J. A. y Tassile, J. L. (2006). Recursos Naturales de la Provincia de Córdoba. Los Suelos. Nivel de Reconocimiento 1:500000. Córdoba, Argentina: Agencia Córdoba Ambiente S.E. e Instituto Nacional de Tecnología Agropecuaria Estación Experimental Agropecuaria Manfredi.

GRASS Development Team. (2018). GRASS (versión 7.6) [Software de cómputo]. Recuperado de grass.osgeo.org/

Hargrove, W. W., Hoffman, F. M. y Hessburg, P. F. (2006). Mapcurves: a quantitative method for comparing categorical maps. Journal of Geographical Systems, 8 (2), 187. https://doi.org/10.1007/s10109-006-0025-x

Hartigan, J. A. y Wong, M. A. (1979). Algorithm AS 136: a k-means clustering algorithm. En Applied Statistics. https://doi.org/10.2307/2346830

Henry, L. y Wickham, H. (2018). purrr: Functional programming tools (versión 0.2-2) [Software de cómputo]. Viena, Austria: The Comprehensive R Archive Network: Contributed Packages.

Hijmans, R. J. (2018). Geographic Data Analysis and Modeling (versión 2.8-19) [Software de cómputo]. Viena, Ausitra: The Comprehensive R Archive Network: Contributed Packages.

Ifraestructura de datos espaciales de la República Argentina (IDERA) (s. f.). Recuperado de https://idera.gob.ar

Instituto Geográfico Nacional (IGN) (2013). Coberturas del Suelo [Archivo de datos]. Recuperado de https://ign.gob.ar

Instituto Geográfico Nacional (IGN) (2018). MDE-Ar: Modelo Digital de Elevaciones de la Argentina [Archivo de datos]. Recuperado de https://ign.gob.ar

Instituto Nacional de Tecnología Agropecuaria (INTA) (2018). Suelos de la República Argentina 1:500000 y 1:1000000 [Archivo de datos]. Recuperado de http://geointa.inta.gov.ar/geoserver/web/

Jarsún, B. (1981). Génesis, taxonomía y aptitud de los suelos. Departamentos Marcos Juárez y Unión (Provincia de Córdoba). Disertación doctoral no publicada, Universidad Nacional de Córdoba, Córdoba, Argentina.

Kane, M. J., Emerson, J. W., Haverty, P. J. y Determan, C. (2018). bigmemory: Manage Massive Matrices with Shared Memory and Memory-Mapped Files(versión 4.5.33) [Software de cómputo]. Viena, Austria: The Comprehensive R Archive Network: Contributed Packages.

Kane, M. J., Emerson, J. y Weston, S. (2013). Scalable Strategies for Computing with Massive Data. Journal of Statistical Software55(14), 1-19. doi: 10.18637/jss.v055.i14

Kim, S.-R., Prasad, A. K., El-Askary, H., Lee, W.-K., Kwak, D.-A., Lee, S.-H. y Kafatos, M. (2014). Application of the Savitzky-Golay Filter to Land Cover Classification Using Temporal MODIS Vegetation Indices. Photogrammetric Engineering y Remote Sensing, 80(7), 675-685. doi: 10.14358/PERS.80.7.675

LP DAAC - Land Processes Distributed Active Archive Center. (s. f.). MODIS Products Table.Recuperado de lpdaac.usgs.gov

Luti, R., de Solís, M. B., Galera, F., de Ferreira, N. M., Berzal, M., Nores, M. y Roque, M. (1979). Vegetación. En J. Vázquez, R. Miatello, y M. Roque (Eds.), Geografía Física de la Provincia de Córdoba (pp. 268-297). Buenos Aires: Boldt.

MAyDS. (2018). Sistemas de Usos de Tierras en Argentina [Archivo de datos]. Recuperado de http://geo2.ambiente.gob.ar/geoserver/wfs

Microsoft y Weston, S. (2017). foreach: Provides Foreach Looping Construct for R(versión 1.4.7) [Software de cómputo]. Viena, Austria: The Comprehensive R Archive Network: Contributed Packages.

Morello, J., Matteucci, S. D., Rodríguez, A. F. y Silva, M. E. (2012). Ecorregiones GEPAMA. Ecorregiones y complejos ecosistémicos argentinos [Archivo de datos]. Recuperado de http://geo2.ambiente.gob.ar/geoserver/wms?SERVICE=WMS&

Muenchow, J., Schratz, P. y Brenning, A. (2017). RQGIS: Integrating R with QGIS. The R Journal, 9(2), 409-428. Recuperado de https://cran.r-project.org/package=RQGIS

Naimi, B. (2018). rts: Raster Time Series Analysis(versión 1.0-47) [Software de cómputo]. Viena, Austria: The Comprehensive R Archive Network: Contributed Packages.

National Aeronautics and Space Administration (NASA) (s. f.). Recuperado de https://search.earthdata.nasa.gov

Nowosad, J. y Stepinski, T. F. (2018). Spatial association between regionalizations using the information-theoretical V-measure. International Journal of Geographical Information Science, 32(12), 2386-2401. doi: 10.1080/13658816.2018.1511794

Olofsson, P., Foody, G. M., Herold, M., Stehman, S. V., Woodcock, C. E. y Wulder, M. A. (2014). Good practices for estimating area and assessing accuracy of land change. Remote Sensing of Environment, 148, 42-57. doi 10.1016/j.rse.2014.02.015

OSGEO Development Team (2018). PostgreSQL/PostGIS (versión 3.0) [Software de Cómputo]. Recuperado de https://postgis.net/

Oyarzabal, M., Clavijo, J., Oakley, L., Biganzoli, F., Tognetti, P., Barberis, I.,León, R. J. C. (2018). Unidades de vegetación de la Argentina. Ecología Austral, 28(1).doi: 10.25260/EA.18.28.1.0.399

Paparrizos, J. y Gravano, L. (2015). E55--k-shape: efficient and accurate clustering of time series. Proceedings of the 2015 ACM SIGMOD International Conference on Management of Data, 1855-1870. doi: 10.1145/2723372.2737793

Puchet, A. y IGN. (2017). Límites políticos administrativos [Archivo de datos]. Recuperado de https://ign.gob.ar

Puchet, A. y IGN. (2018). Aguas continentales [Archivo de datos]. Recuperado de https://ign.gob.ar

QGIS Development Team. (2018). QGIS (versión 2.6) [Software de cómputo]. Zúrich, Suiza: Qgis. Recuperado de https://www.qgis.org

R Core Team (2018). R: A language and environment for statistical computing (versión 3.6.1) [Software de cómputo]. Viena, Austria: The Comprehensive R Archive Network: Contributed Packages. Recuperado de https://cran.r-project.org/

Rosenberg, A. y Hirschberg, J. (2007). V-Measure: A Conditional Entropy-Based External Cluster Evaluation Measure. Proceedings of the 2007 Joint Conference on Emprical Methods in Natural Language Processing and Computational Natural Language Learning. doi: 10.7916/D80V8N84

Ryan, J. A. (2018). mmap: Map Pages of Memory (versión 0.6-17) [Software de cómputo]. Viena, Austria: The Comprehensive R Archive Network: Contributed Packages.

Savitzky, A. y Golay, M. J. E. (1964). Smoothing and Differentiation of Data by Simplified Least Squares Procedures. Analytical Chemistry, 36(8), 1627-1639. https://doi.org/10.1021/ac60214a047

Solano, R., Didan, K., Jacobson, A. y Huete, A. (2015). MODIS Vegetation Index User’s Guide (MOD13 Series). Vegetation Index and Phenology Lab, The University of Arizona. doi: 10.5067/MODIS/MOD13Q1.006

Vermote, J. C. y Ray, J. P. (2015). MODIS Surface Reflectance User’s Guide collection 6. MODIS Land Surface Reflectance Science Computing Facility. doi: 10.5067/MODIS/MOD09A1.006.

Wan, Z. (2013). MODIS Land Surface Temperature Products User’s Guide. doi: 10.5067/MODIS/MOD11B3.006

Wan, Z., Hook, S. y Hulley, G. (2015). MOD11A2 MODIS/Terra Land Surface Temperature/Emissivity 8-Day L3 Global 1km SIN Grid V006. [Archivo de datos]. doi: 10.5067/MODIS/MOD11A2.006

Wickham, H. (2011). The Split-Apply-Combine Strategy for Data Analysis. Journal of Statistical Software, 40(1), 1-29. doi: 10.18637/jss.v040.i01

Wickham, H. (2015). Advanced R. doi: 10.1007/978-1-4842-2077-1