Pig se creó para simplificar la carga de escribir códigos Java complejos para realizar trabajos de MapReduce. Los desarrolladores anteriores de Hadoop tienen que escribir códigos java complejos para realizar análisis de datos. Apache Pig proporciona un lenguaje de alto nivel conocido como Pig Latin que ayuda a los desarrolladores de Hadoop a escribir programas de análisis de datos. Al usar varios operadores provistos por los programadores de lenguaje Pig Latin, pueden desarrollar sus propias funciones para leer, escribir y procesar datos.
Para realizar el análisis con Apache Pig, los programadores deben escribir scripts con lenguaje Pig Latin para procesar los datos almacenados en el Sistema de archivos distribuidos de Hadoop. Internamente, todos estos scripts se convierten en tareas de Mapa y Reducir. Un componente conocido como Pig Engine está presente dentro de Apache Pig en el que los scripts de Pig Latin se toman como entrada y estos scripts se convierten en trabajos Map-Reduce.
- ¿Qué significa cuando un perro se frota el trasero con el piso?
- ¿Por qué los gatos le temen al agua? ¿Por qué la mayoría de los gatos temen / odian mojarse? ¿Hay alguna explicación biológica, psicológica o conductual para esto?
- ¿Cómo se aseguran las personas que poseen un perro mascota de que se mantengan bien mientras están fuera por trabajo?
- ¿Cómo me hago amigo de un gato? Hay un gato que a menudo entra a mi departamento. Quiero acariciarlo, pero cada vez que trato de hacerme amigo de ella o alimentarla, ella se escapa.
- ¿Cuánto cuesta el aseo de mascotas en PetSmart?
Características del cerdo
Apache Pig viene con las siguientes características únicas:
Conjunto rico de operadores: Pig consiste en una colección de un conjunto rico de operadores para realizar operaciones como unir, archivar, ordenar y muchos más.
Facilidad de programación: Pig Latin es similar a SQL y, por lo tanto, es muy fácil para los desarrolladores escribir un script de Pig. Si tiene conocimiento del lenguaje SQL, es muy fácil aprender el lenguaje Pig Pig, ya que es similar al lenguaje SQL.
Oportunidades de optimización: la ejecución de la tarea en Apache Pig se optimiza automáticamente por la tarea misma, por lo tanto, los programadores solo deben centrarse en la semántica del lenguaje.
Extensibilidad: al utilizar los operadores existentes, los usuarios pueden desarrollar fácilmente sus propias funciones para leer, procesar y escribir datos.
Funciones definidas por el usuario (UDF ): con la ayuda de la facilidad proporcionada por Pig para crear UDF, podemos crear fácilmente funciones definidas por el usuario en varios lenguajes de programación como Java e invocarlas o insertarlas en Pig Scripts.
Todos los tipos de manejo de datos: Apache Pig proporciona el análisis de todos los tipos de datos (es decir, tanto estructurados como no estructurados) y los resultados se almacenan dentro de HDFS.