[Música] estamos listos Jorge perfecto bienvenidos todas y todos a esta nueva videoconferencia del año 2022 que se realiza en el marco de la red de transmisión del conocimiento rtc con la que iniciaremos una serie de videoconferencias en donde estaremos tratando distintas aristas del uso del big Data para la producción de Estadísticas oficiales Soy Jorge Andrés Urrutia jefe del departamento de infraestructura estadística del Instituto Nacional de estadística de chile y en esta oportunidad estaré guiando gustosos esta videoconferencia desde el Instituto Nacional estadística de chile INE trabajamos con entusiasmo para contribuir en la cooperación y difusión del
conocimiento estadístico a través de la plataforma de la rtc en esta ecuación nos complace presentar el Resultado de un trabajo colaborativo entre la comisión económica para América Latina y el Caribe cepal y el General Hub de Brasil y el INE de chile quienes hemos trabajado para la organización de esta videoconferencia que tiene por propósito entregar una visión general del big Data para su uso estadístico destacando su potencial y señalando los retos existentes para la producción de estadísticas oficiales con este objetivo se presentarán dos Experiencias de la región de las oficinas estadísticas de Brasil y México
que permitan inspirar a otras oficinas a seguir el mismo camino propiciando así el aumento del número de organismos estadísticos que hagan uso del big Data para propósitos estadísticos antes de dar inicio queremos recordarles que pueden hacer llegar sus preguntas y comentarios durante la actividad a través del canal de chat de igual manera al final de la presentación tendríamos Un espacio para resolver sus consultas y si lo desean podrán levantar su mano y se abrirán sus micrófonos Mientras tanto le agradeceremos mantener los micrófonos en silencio para iniciar este evento dejo en primer lugar con ustedes a
Don Rolando Ocampo director de la división de estadísticas de la cepal para que nos pueda compartir su palabra de bienvenida Rolando bienvenido adelante por favor Muchas gracias Jorge Muy buenos días a todos ustedes es un placer estar en este en este seminario en este webinario titulado Big Data para la elaboración de estadísticas oficiales Quiero agradecer y saludar a nuestros amigos de de la escuela de estadística del IVA y como coordinadora del Job Regional de Big Data de las Naciones Unidas a nuestros amigos por supuesto de línea de chile que tanto nos han ayudado con estas
con las transmisiones de la red de Transmisión de conocimiento y a todos los países a los dos países que nos van a compartir sus experiencias y por supuesto a los más de 251 colegas que hasta el momento están conectados este a esta interesante Interesante webinario como todos ustedes saben existe una creciente demanda de tener más y mejor información en en tiempo real para tomar decisiones basadas en evidencia lo que obliga a reflexionar sobre la forma en la que se producen las Estadísticas oficiales y principalmente el conjunto de fuentes de información en un mundo que produce
un ingente y creciente volumen de datos facilitados por las nuevas tecnologías el mayor incremento de los datos es consecuencia de los más de 150 millones 150 mil millones de dispositivos que están conectados a la red a través de los denominados internet de las cosas o el famoso internet de las cosas esto porque la información Generada por los diferentes aparatos de nuestra vida diaria y cotidiana están conectados a internet Esto va a aumentar y esta y esta tendencia va a aumentar de manera importante Durante los próximos años a pesar de la pandemia y los vaivenes económicos
nuestro uso de herramientas digitales para satisfacer nuestras necesidades personales y comerciales se potenció este sustancialmente Durante los últimos 10 años la participación Digital a través de las redes sociales la transmisión de contenidos las compras en línea los pagos entre pares y otras actividades se han incrementado en miles de puntos este porcentuales es decir se ha potenciado n veces y muchas veces este proceso según la unión internacional de telecomunicaciones aproximadamente 5.300 millones de personas o el 66% de la población mundial utiliza internet en este año 20 20 22 lo que representan Aproximadamente un 24% de aumento
En comparación con hace tres años en 2019 Si vemos algunos resultados como los que los nos presenta el Domo a través de su infografía los datos nunca duermen ahora en 2022 cada minuto del día la gente envía 16 millones de mensajes de texto se hacen 5.9 millones de búsquedas en Google los usuarios de Facebook comparten 1.7 millones de piezas de contenido se envian 231.4 millones de mensajes por Correo electrónico y se comparte 66,000 fotos en instagram etcétera los compradores de Amazon gastan 443 mil dólares cada minuto eres Por cierto Yo hace antes de entrar aquí
Estaba comprando mis cápsulas de nespresso y estaba corriendo en lo que me hacía la presentación para poner los datos en el internet es es muy muy muy muy muy muy muy muy importante este y significativa el uso De los datos de internet para todo para todas las cosas y Y eso nos da todo este potencial si bien estos valores nos dan cuenta del volumen de la cantidad de datos que se generan de manera permanente el incremento observado en los últimos años es aún más indicativo de este fenómeno el mundo está viviendo una Revolución la revolución
de los datos transformando todas nuestras sociedades facilitando la toma de decisiones e Incrementando la exigencia del cumplimiento de responsabilidades y la rendición de cuentas en el cumplimiento de sus derechos no sé si ustedes recuerdan hace 40 años tal vez menos treinta y tantos años con la invasión de Estados Unidos Irak apenas veíamos algunas fotos de cómo los cohetes iban en las noches y le sean Hoy estamos viendo las cosas en línea en un solo día se hizo todo un todo un evento todo un escándalo sobre los dos misiles que Cayeron en la frontera con Polonia
acusando a Rusia y después la corrección de que fueron unos O sea ya las identificación todo eso es como se potencia todos los procesos Y cómo los tuits y vemos ya todos los temas los asaltos y todo ese tipo de cosas los eventos las marchas las manifestaciones etcétera Y eso tiene que ver con la revolución de los datos que está transformando a nuestras este a nuestras sociedades Esta Es la revolución es este es un concepto que abarca los datos abiertos el aumento de la colaboración pública como le llamamos cropsourcing las nuevas tecnologías de la información
y la comunicación la disponibilidad de macrodatos la Inteligencia artificial el internet de las cosas etcétera la mayoría de los datos provienen de la huella digital que dejan las personas en el uso cotidiano y diario de estas nuevas tecnologías Aplicaciones y dispositivos digitales que los diversos algoritmos recogen y ponen a disposición del público cada vez más sabido este de es de poder explotar este tipo de información con múltiples y diversas intenciones es por ello que se vuelve fundamental la necesidad de establecer protocolos y estándares de uso que garanticen a los la confidencialidad la intimidad la ética
y el respeto de los derechos de los individuos generadores de estos Datos sin disminuir su potencial de uso para fines colectivos a esto se ASUME el riesgo del aumento de la desigualdad entre aquellos que tienen acceso a información y los que no tienen acceso el uso de la tecnología la la la penetración del internet en las zonas urbanas en las zonas Rurales son un elemento que nos permite y que y que tiene tiene que ayudarnos a abatir esas desigualdades de la información y por por consecuencia Pues abatir de manera Sustantiva también las desigualdades nosotros como
sistemas estadísticos nacionales y en particular las oficinas estadísticas nacionales de estadística como antes rectores del quehacer estadístico nacional debemos estar a la vanguardia de los procesos que aseguren una integración adecuada de estos nuevos datos con datos tradicionales ya muchos ejercicios se han estado haciendo en el barco de la comisión de estadística de Naciones Unidas para poder llevar a cabo para ello Es necesario invertir en nuevas tecnologías Innovación metodológica inclusión de perfiles profesionales a la altura de las acciones a emprender capacitando a nuestros equipos técnicos en favor de un intercambio de un cambio de paradigma que
está dándose ya en nuestros institutos Pero esto no es suficiente la arquitectura institucional largo organización de los activos de personal Y procesos participantes de las cadenas de producción las estadísticas oficiales necesitan esta reflexión importante de tal forma que acompañen y no detengan el cambio necesario para estas demandas a pesar de todos estos desafíos por enfrentar es válido remarcar que se abre un espacio de oportunidades muy poco previstas hace dos décadas atrás en particular cuando estábamos trabajando con los objetivos del milenio esta Información Abre posibilidades que podrán adaptarse para conseguir en tiempo real un nuevo conocimiento
sobre el bienestar de las personas así como para ayudar de una mejor manera los grupos más vulnerables si se usan responsablemente estas nuevas tecnologías con datos y análisis pueden mejorar el monitoreo del Progreso en el cumplimiento de las metas de los objetivos de desarrollo sostenible y conseguir de esta manera que sean al Mismo tiempo inclusivos y justos Déjenme darles algunos datos en los que podríamos utilizar estos datos por ejemplo en el caso de los del objetivo uno el fin de la pobreza las tendencias de gastos de los servicios de telefonía móvil podrían proporcionar indicadores indirectos
sobre los niveles de ingreso sobre el objetivo 2 hambre cero el cropsorcido seguimiento de los precios de los alimentos en internet que ya se Está empezando a usar en los índices de precios al consumidor y en los índices de comparaciones internacionales puede ayudar a controlar la seguridad alimentaria casi en tiempo real en el obs 3 salud y bienestar rastrear el movimiento de los usuarios de teléfonos móviles puede ayudar a predecir la propagación de enfermedades infecciosas como sucedió en el seguimiento de la pandemia varios el INE de chile tuvo un proceso el Inegi de México y
otros el Dane de Colombia también tuvo un esfuerzo muy importante para trabajar y desarrollar todos estos casos el objetivo ods 11 ciudades y comunidades sostenibles la teleobservación por medio de imágenes satelitales puede rastrear la intrusión de tierras o espacios públicos como los bosques y los parques públicos el ods13 acción contra el clima Pues bueno la combinación de imágenes satelitales de nos puede dar los testimonios de personas que están Invadiendo todas estas partes de las de las áreas protegidas naturales en términos del ods 15 la vida de ecosistemas terrestres las redes sociales también pueden ayudar a
gestionar los desastres con los deshaces provocados por fenómenos naturales o los desastres también provocados por nosotros los ciudadanos con información instantánea sobre la ubicación de estas víctimas y finalmente lo de ese 16 sobre la paz justicia e instituciones Pues el Análisis de las emociones en las redes sociales puede darnos un una idea sobre cómo se encuentra la opinión pública en temas como la gobernanza eficaz la prestación de servicios públicos o los derechos humanos en fin las posibilidades son muchas y es tiempo de innovar y de nosotros adecuarnos como oficinas estadísticas para tener las normativas que
nos permitan usar todo este tipo de información de mejor manera Hoy vamos a escuchar como lo comenté algunas experiencias reveladoras de los avances que se están dando en la región que esperamos sean los primeros pasos de una agenda de trabajo regional liderada en conjunto del Job de este de este Job regional Yo sin más este me me quedo hasta aquí Jorge yo les agradezco mucho solamente mencionarles que en estos cinco minutos cefalinos pude me ajuste pero se incrementaron se incorporaron más de 50 Colegas más a esta a esta transmisión ya tenemos una audiencia de 300
más y de aquí la importancia de Dar seguimiento a esta a esta conferencia Muchas gracias y la de muchas muchas gracias a los ponentes que van a estar y Roberto you Jorge para seguir con el proceso gracias perfecto muchas gracias Rolando por tus inspiradoras palabras de bienvenida confiamos también de que este sea el primer gran paso no es cierto es lo que nosotros podamos hacer en la región con El resto de la oficina estadística Así que muchas gracias nuevamente a continuación invito también a María Díaz Bueno del centro de documentación y diseminación de información del
Ivy para que nos brinde sus saludos en representación del usn dictador de Brasil por favor María overtuyú la palabra es tuya buenos días a todos Yo estoy aquí en nombre del joven de las relaciones Unidas para mi vida Data en Brasil para Saludar a todos que sean todos muy Bienvenidos como este evento empezamos una alianza con rtc la red de transmisión del conocimiento y Esperamos que esta Alianza sea consoliden entrega beneficios para todos los involucrados tiene como objetivo principal contribuir para el abuso del uso debilidad para mejorar la producción de estadísticas promoviendo el intercambio de
Conocimientos y también el desarrollo de la iniciativa innovadores en toda América Latina y el Caribe y este es un evento que forma parte de nuestro plan de trabajo para el periodo 20 22 20 23 dentro de las actividades de orden hemos programado una serie de seminarios virtuales enfocados en el uso de datos de teléfonos móviles el mes pasado en octubre tuvimos un seminario hablando sobre los retos y perspectivas de uso de Esta fuente de datos hoy vamos a hablar de Big Data de una manera más amplia el próximo mes tendremos un evento hablando de estadísticas
de migración usando datos de teléfonos móviles y para el próximo año tenemos seminarios mensuales a partir de febrero siempre trayendo una temática diferente Pero tiene en común el uso de datos de teléfonos móviles hablaremos sobre estadísticas de turismo de población de transporte y movilidad De sociedad de la información desplazamientos puedes hacer natural naturales y otros más hablado de modelos de acceso estos datos Y también sobre innovaciones tecnológicas y metodológicas y siempre que posible traernos tratando de traer ejemplos de estudios realizados en la región Así que invito a todos los interesados a visitar nuestro sitio web
en hoodi.ibg.ve para conocer las fechas y los temas de Nuestras próximas actividades y también para poder ver las grabaciones de las actividades pasadas eso Muchas gracias que tengamos todos un buen evento gracias Muchas gracias a ti María por tu intervención y saludos en esta conferencia virtual bueno para dar inicio a este webinar quiero presentar y dejar con ustedes al profesor cristiano ferraz quien nos mostrará la experiencia en el uso del big Data en Brasil con su Presentación llamada Big Data y estadísticas oficiales el señor ferraz es profesor de estadística de la universidad Federal de pernambuco
e investigador del Cash lab el laboratorio de estadísticas computacionales agropecuarias además es profesor y miembro del equipo del ufm vitara regional en Brasil y también se desempeña como consultor internacional en muestreo probabilístico profesor ferraz dispone usted de 15 Minutos para su presentación cuando le resten solamente tres le avisaré para que pueda generar la conclusiones de su ponencia por favor profesor ferraz adelante Muchas gracias Jorge Bueno yo voy compartila mi pantalla desde aquí un minuto puedes ver la pantalla pueden perfecto se ve perfecto vale vale bueno Muchas gracias por la invitación para mí es un placer
estar aquí y hablar un poco con Ustedes mi presentación Es muy simple en 15 minutos yo voy a intentar hablar un poco al respecto de Big Data estadísticas oficiales pero de una forma muy amplia no y creo que para eso una de las preguntas claves que son importantes de intentar responder es Qué es Y por qué considerar el uso de bicicleta estadísticas oficiales Bueno hay muchas posibilidades de respuestas para una pregunta tan amplia Como esa pero a mí me parece que la respuesta para ese tipo de pregunta está en reconocernos los cambios comportamentales que han
sido consolidados a lo largo del tiempo esos cambios comportamentales tienen una influencia muy grande de la tecnología que fue generada y una tecnología muy avanzada y muy distinta déjame bueno Sí si paramos un poco para pensar en Cómo no se sabe tus comportamentales y están consolidados hoy vamos a persever que eso está muy relacionado con toda la estructura que tenemos de acumulación de datos de tecnología de redes sociales nuevas formas de comunicación y de comercio por la internet la internet de las cosas el tipo de información que tenemos para monitorear la tierra la movilidad de
entre todas otras cosas más entonces si vamos per se ve un poquito algunos de Los ejemplos relacionados con el sistópicos podemos ir por ejemplo que hoy en día la interacción y comunicación entre personas a través de los teléfonos móviles y de las redes sociales con más frecuencia que las iteraciones personales el impacto de esa constatación es muy grande porque y se genera una cantidad de datos comportamentales en la plataforma digital que es incomparable Con lo que teníamos a 10 20 años atrás hoy en día es posible a través de ese tipo de datos estudiar por
ejemplo un padrón y comportamiento de las personas y ese patrón de comportamiento sin duda es posible de ayudar y contribuir con la formación la generación de estimaciones de estadísticas oficiales otro ejemplo que tenemos dice Respecto a los dados de movilidad separamos para pensar un poco vemos Que En efecto hoy hoy en día se usan más las direcciones a través de sistemas de navegación en línea que a través de mapas impresos entonces todo todo el proceso de direccionamiento de saber río referenciar dónde estamos para dónde vamos y su todo es registrado y almacenado en una plataforma
digital generando datos y movilidad que más una vez son muy grandes muy gigantescos y de Gran importancia para la sociedad una otra posibilidad de constatación son los datos financieros no personas hoy pagan sus cuentas a través de los medios digitales con más frecuencia que con efectivo él es también los son más los bancos digitales que los físicos ese tipo de información por estar relacionado con la plataforma digital financiera está registrado y nos permite validar los Comportamientos financieros de las personas Cómo es el gasto Cómo es el el diferenciamiento de las monedas cómo está el cambio
entre países por ejemplo Son son tipos de datos que también son disponibles hoy y que a 20 y 30 años atrás no no se tenga tanto así entonces es universo nuevo para terminar los ejemplos internos de comportamientos uno más Se da a través de la disponibilidad que tenemos con la tecnología de tele detección imágenes de satélites con eso podemos monitorear la tierra con respecto a una serie de informaciones por ejemplo al cambio climático uso del Sol del suelo catástrofes eventuales de la naturaleza o causadas por por los humanos hay una capacidad hoy de revista imágenes
en Prácticamente todo el planeta Y eso es almacenado más Una plataforma digital entonces a todo ese conjunto de informaciones que hoy están disponibles tenemos un nombre paraíso el nombre es Big Data aquí el aspecto fundamental que yo creo que que es necesario a llamar atención para es que Big Data para nosotros que somos de estadísticas oficiales es una fuente estratégica de información esa es es la mensaje principal que yo pienso entonces hemos vivido como una Gigantesca diversidad de informaciones almacenadas en la era digital y caracterizadas por pilomeños 33 cualidades tres características la primera es el
Grande volumen de datos es uno volumen que se estima que para pocos años adelante estaremos hablando de cerca de 177 bytes de información y eso es mucha información pero no es apenas una Cuestión de volumen es un volumen registrado en una gran diversidad en tiempo real a todo instante tenemos a través por ejemplo de las redes sociales información al respecto de cómo las personas están se comunicando sintiendo cómo está un ríoagiendo a ciertas ser tus estímulos señales por ejemplo de una guerra de una de una crisis financiera pases ese ese volumen de datos en una
gran velocidad es fundamental para para definir vigueta Pero hay todavía una Otra calidad que es muy importante que es la gran variedad de contenido y estructura entonces viguerita no es un conjunto de edades que están muy bien estructurados y disponibles a toda hora sino que una gran y gigantesca masa de información que necesita necesita de técnicas específicas para ser en sembrada para ser trabajada y para generar información que sean útiles no así que tenemos esa definición de Vegeta que como fuente de estratégica de Información es es muy importante no no podemos negar la existencia de
ese tipo información que es diferente de la información y de la Fuente tradicional que los institutos y estadísticas están acostumbrados a trabajar por si apenas ese facto sería la justificativo para buscar Innovación de trabajo con big Data nosotros no podemos dejar de tener esos datos a nuestra ventaja pero trabajar con Big Data significa también tener en consideración sus desafíos no el primer desafío que yo yo me gustaría hablar un poco es el desafío metodológico el uso de Big Data yo estaba comentando ahora poco necesita dime métodos específicos de captura de información y análisis de datos
pero no es apenas la parte computacional que por sí sola es muy complicado no y yo cree que mis colegas no hablan un poco más a Profundizado al respecto sino considerar también aspectos estadísticos en muchas situaciones si no se toman las los cuidados necesarios hacer estimación vaciada Peña sin vigilada por generar sesgo entonces hay que tener un estudio metodológico muy desarrollado para trabajar con vivienda es parte del desafío de hoy trabajar con metodología que se haya posible a decir aplicar habilidad para que nosotros Podemos tener los beneficios de esa fuente estratégica de información además hay
otro punto que yo voy a hablar rápidamente Qué son los retos con respecto a la privacidad de los usuarios ese reto es siempre estuvieron presente para los institutos de estadística pero ahora se pone en una cámara de desafío diferente por estar en una nube estar en una plataforma digital de una complexidad como la debilidad que nosotros Hablados ahora por final una una pregunta que es muy importante para que nosotros respondamos es Cómo hacer el uso responsable de esa cantidad de informaciones para generar y mejorar estadísticas oficiales esa es una gran pregunta que claro no se
puede responder en uno o dos minutos pero es importante destacar las iniciativas de las Naciones Unidas En esa dirección vale Y entonces sabemos que por contra de esas Iniciativas tenemos por lo menos le quedan tres minutos vale vale tenemos entonces la plataforma global los testings y los hobbies regionales entonces rápidamente cuatro Pilares de trabajo aquí uno parceros confiables datos confiables métodos confiables y aprender confiable los tres están divididos en y no de categorías Yo no voy me han entrado Mucho en cada una de ellas porque yo voy a yo voy a hablar apenas en la
existencia de cuatro grandes personales Brasil china emiratos Árabes y Ruanda Vale entonces con eso todo nos tenemos a en Brasil claro El joven regional que fue creada en abril de 2021 y que está ubicada en las la escuela nacional de ciencias estadísticas yo al finalizar aquí porque a los dos ejemplos que yo tenía son muy Simples y creo que ahora es importante adentrar en ejemplos más a profundizados pero la última mensaje que yo gozaría tiene que pasar es que es Big Data es una fuente acá importante dice considerar no podemos es que se nos obligarte
eso y nos pone desafíos de trabajo en conjunto Bueno yo voy finalizar por aquí Jorge y si hay preguntas estoy a disposición también Gracias perfecto muchas gracias profesor ferraz La pregunta la dejaremos para el espacio reservado al final e igualmente invitamos a la audiencia a aprovechar nuestro canal de chat para ir dejándola no cierto plan más y retomarla en su momento de igual manera Bueno le agradecemos nuevamente a profesor Fernando por su presentación en la que pudo dar cuenta de la necesidad de utilizar los datos que nos rodean hoy en día y va con entorno
digital y tecnológico nuevo y que nos enfrenta a Nosotros como oficina de estadísticas de no solo utilizar las fuentes tradicionales de datos para la producción estadística oficiales sino también las nuevas tanto aquellos datos estructurados como no estructurados todo lo Obviamente con las de vías Providencia de los recuerdos asociados a esta gestión de macrodato Tal como la seguridad El Respeto del secreto estadístico el acceso la rendición de cuenta tal como lo Mencionaba también Rolando entre otras Así que Nuevamente muchas gracias profesor ferraz Gracias Jorge continuando con el programa Ahora les quiero presentar al doctor helio Villaseñor
García quien nos expondrá la experiencia del Inegi de México y su laboratorio de ciencia de datos el señor Villaseñor Es doctor en ciencia de la computación maestro en ciencias matemáticas y matemático por la Universidad Nacional Autónoma de México Hay partido cursos a nivel de licenciatura y maestría así como también ha diseñado programas de posgrado en la temática de ciencia de datos como investigador ha llevado a cabo proyectos de investigación aplicada y desarrollo tecnológico así como la coordinación de distintos laboratorios de ciencia de datos en el Inegi actualmente lidera diversos proyectos que involucran el aprovechamiento de
fuentes y Metodologías alternativas para la generación de información estadística y geográfica en México doctor Villaseñor dispone usted de 15 minutos para su presentación y al igual que en el caso anterior cuando le resten los últimos tres le avisaré para que pueda generar la conclusiones de su presentación por favor doctor la palabra de usted Muchas gracias ya pueden ver mi presentación se ve perfecto adelante excelente Bueno pues muy buenos días a Todos es un gran gusto estar aquí en este evento agradecemos mucho la invitación el Job regional para compartir nuestra experiencia en el aprovechamiento de Big
Data fuentes alternativas y la ciencia de datos bien el objetivo del laboratorio de ciencia de datos del Inegi surge como una para cubrir la necesidad de promover la práctica de la ciencia de datos al interior del instituto así como Intercambiar experiencias en la materia con organismos internacionales y nacionales desarrollar metodologías para la generación de información estadística y geográfica e impulsar El Talento ya Rolando nos ha dado una panorama muy amplio del contexto en el cual surge esta necesidad de aprovechar la gran cantidad de información que se genera diariamente aquí en esta ilustración Simplemente estoy mostrando
Nuestra recolección de tweets que diariamente realizamos y y su calificación de sentimiento que al igual con un proceso automático se pueden hacer este este monitoreo de los usuarios de Twitter y bueno tranquilo que también se resaltó es el aprovechamiento de la Inteligencia artificial como una de estas herramientas o metodologías innovadoras que también permiten generar nueva información Y bueno surge la pregunta para qué una oficina de estadística como como y geografía como el Inegi necesita o o este tiene la necesidad de aprovechar esta ciencia de datos Bueno este en primer lugar para desarrollar capacidades en el
aprovechamiento de estas Fuentes y métodos alternativos de de generación de información generar nuevos productos por supuesto No En estadística y análisis espacial experimental en nuestro caso pero También para ser más eficientes los procesos de producción que actualmente se tienen en las oficinas de estadística y también para dar un mejor servicio a nuestros usuarios a continuación voy a hablar un poco de cada uno de estos aspectos lo que hemos estado haciendo en el laboratorio de ciencia de datos del Inegi bien en cuanto a desarrollo de capacidades lo primero que que nos dimos cuenta era que necesitábamos
contar con Una plataforma tecnológica que nos permitiera aprovechar distintas fuentes de información estas podrían estar presentes en la web como son las redes sociales pero también los precios de productos las noticias obviamente estas Fuentes digamos de la web poder combinarlas con Fuentes tradicionales que son las que tenemos en el instituto pero también con información geoespacial ya se mencionó el aprovechamiento de Imágenes satelitales y también información de terceros que no no estaba necesariamente disponible en la web y que requiere de un esquemas de seguridad mucho más estrictos como pueden ser las la información de transacciones bancarias
se requiere también una unidad especializada en extraer esta información poder integrarla a los a la arquitectura de Big Data en el caso de redes sociales por ejemplo es muy Importante poder aprovechar el almacenamiento distribuido y esto cargarlo en un lago de datos que permita ver a todos estos datos de una manera unificada para eso es importante contar con ingenieros de datos que permitan hacer esta carga una vez en el lago pues aplicar distintos procesos de transformación de datos que permitan presentar esta información e integrarla y combinarla de tal forma que pueda ser aprovechada por los
métodos analíticos Que principalmente son métodos de aprendizaje a computacional e Inteligencia artificial y para esto necesitamos tener la flexibilidad de contar con areneros que nos permitan hacer estas implementaciones con la finalidad general prototipos de datos que puedan ser entregados a nuestros clientes que en este caso pueden ser las diversas direcciones generales de del Inegi o también usuarios externos y bien esta esta idea conceptual pues la La hemos implementado utilizando herramientas de software libre que actualmente se ocupan en en la ciencia de datos y hemos definido estas capas de ingestión almacenamiento virtualización que esa es la
clave digamos para la integración interoperioridad de los datos la integración en la conformación de los modelos de representación la aplicación de los métodos analíticos y Otra parte que también es muy importante para ya los usuarios finales el tener la capacidad de tener distintas vistas de estos datos y poder presentarlos de manera visual de tal forma que sea intuitivo su análisis esto lo hemos conformado en lo que llamamos un lago de datos en el cual también han intervenido diversas unidades del del Inegi principalmente de la coordinación general de informática que Nos ha provisto del de la
tecnología y del soporte para poder llevar a cabo este despliegue tecnológico otra digamos elemento de de capacidades tecnológicas que hemos desarrollado en los últimos años es lo que se conoce como el cubo de datos espaciales de México que es una infraestructura computacional que permite explotar de manera muy ágil y eficiente grandes conjuntos de imágenes Satelitales en este caso tenemos todas las imágenes lanza de los últimos 30 años que cubren el territorio nacional es en varias ocasiones y podemos hacer análisis de esta series temporales de imágenes a continuación voy a mostrar algunos ejemplos de cómo hemos
aprovechado toda esta infraestructura tecnológica bien en el caso del desarrollo de nuevos productos la historia comienza pues ya hace 10 Años en donde un grupo de la coordinación general de informática se dio a la tarea de comenzar a recolectar tweets de manera automática con la visión de poder aprovechar esto para generar mediciones del sentimiento de la población y bueno este este este grupo coordinación también con la dirección general de investigación se acercó con la con grupos de centros públicos de investigación para poder desarrollar los Algoritmos que permitieran hacer un análisis de sentimiento de este flujo
de de datos de Twitter una cosa interesante es de que dado que queríamos garantizar que que estos tuits estuvieran en el territorio nacional pues se utilizaron simplemente que eran georreferenciados Y en este en esta imagen podemos ver las coordenadas de esos tuits y Bueno podemos ver cómo se dibuja nuestro país a partir de estas localizaciones Se determina entonces un cociente de positividad que que se genera diariamente con un algoritmo de análisis sentimientos automático y simplemente se dividen los dispositivos entre los tres negativos Ese es nuestro cociente de positividad Y eso se publica diariamente como Les
comento en nuestro sitio del Inegi como una estadística experimental del Estado del ánimo de los tuiteros esto ya tiene desde el 2016 que se que se comenzó a publicar Recientemente como les comentaba hemos desarrollado la capacidad de hacer análisis de las imágenes satelitales tenemos actualmente tres productos de análisis espaciales experimental aquí simplemente les muestro uno de ellos que es el icase el índice de clasificación es de aguas superficial desde el espacio este este índice permite identificar la presencia de agua en el en la superficie así como qué tanto ha aparecido a lo largo del año
Aquella agua que pues sus cuerpos de agua permanentes pues tienen este color azul mientras que los los La ocurrencia o la presencia de agua que no estuvo todo el tiempo pues tienen ya colores verdes o hacia el amarillo esto Pues es de Gran utilidad para poder identificar aquellas zonas vulnerables a inundación por ejemplo o poder observar la la presencia de agua empresas Y cómo como esta agua pues va Variando a lo largo del año y bueno en caudales de ríos etcétera es un producto que tenemos pues ya de de más de 30 años tenemos esta
historia que nos cuenta la presencia del agua en nuestros en nuestra superficie aprovechando pues todas estas imágenes satelitales que ya mencioné también aprovechando estas imágenes satelitales y la y la capacidad de contar historias a partir de ellas pues tenemos también la la la identificación De asentamientos urbanos en los últimos 30 años en el territorio nacional aprovechando en este caso también métodos de Inteligencia artificial para poder identificar estos asentamientos urbanos y bueno este esta metodología está publicada en el tool kit de de de la ONU de ONU habitat atendiendo el indicador 11 de de indicadores de
desarrollo Sostenible y bueno es el caso que presentamos de México aportando a esta esta metodología también aprovechando imágenes satelitales hemos desarrollado la capacidad de identificar tierras de cultivo con una presión bastante bastante buena tenemos arriba del 91%, esto con con imágenes sentinel en este caso que son una una resolución de 10 metros por Pixel Y bueno estas estas estimaciones van a ser verificadas Próximamente con los resultados del censo agropecuario que se está llevando a cabo en el instituto con la idea de que en dado caso de que resulten suficientemente buenas Pues de utilizar este este
recurso como una forma de darle monitoreo a la producción agrícola entre años no censales otro otro ejemplo de aprovechamiento de de las imágenes satelitales es este Proyecto en el cual podemos identificar el grado de marginación de las de los asentamientos humanos basados en La índice de slum Security Index de onuhabitat En donde podemos identificar este estos asentamientos altamente con alta marginación y podemos hacer el mapeo en los últimos 30 años también doctor tenemos le quedan tres minutos Sí muchas gracias da esa que tenemos Esta esta este Archivo bien Cómo podemos aprovechar estas técnicas para ser
más eficientes en nuestra producción Entonces nosotros tenemos encuestas que tienen respuestas que son abiertas Y entonces hay que codificarlas podemos aprovechar entonces toda la la arquitectura que tenemos desarrollado para el procesamiento del lenguaje natural para poder hacer estas codificaciones de manera automática actualmente ya tenemos estas aplicaciones Y hemos demostrado que que con con estas técnicas podemos reducir en un 50% al menos La La La La La las personas que se requieren para hacer la codificación manual de estas respuestas Y bueno con esto ser más eficientes en los procesos de producción estadística mejores servicios hemos también
con este mismo plataforma de procesamiento del lenguaje natural hemos desarrollado una Manera de expandir las búsquedas que hacen nuestros usuarios al sitio del del instituto Y a partir de del de los métodos de Inteligencia artificial los usuarios no siempre con sus búsquedas no siempre encuentran la respuesta pero con estos métodos podemos generar nuevas búsquedas y de esta manera encontrar pues palabras que deciden resultados a sus búsquedas y bueno hemos obtenido una valoración Una prueba de usabilidad de este de este producto obteniendo una mejora sustantiva en la usabilidad de nuestro servidor web de nuestro buscador y
Bueno aquí también son resultados de esta evaluación que se que se que se hizo y esta esta módulo de Inteligencia artificial será implementado en la próxima versión del buscador del bien como conclusiones pues la ciencia de datos Presenta una oportunidad para La modernización de las oficinas de estadística en diversas en diversos aspectos la incorporación de estos métodos representa un cambio de paradigma ya se mencionó una cosa que un mensaje importante es que sin ciencia no es ciencia de datos varios de los proyectos que mencioné han sido también en colaboración con universidades y centros de investigación
una una cosa clave es poder colaborar muy cercanamente con con las oficinas de Las áreas de tecnologías de la información de los institutos para poder hacer estos despliegues tecnológicos y bueno es muy importante poder mostrar el valor que aportan nuestros productos Muchas gracias Muchas gracias doctor Villaseñor por su presentación que creo que muestra una valiosa experiencia para la oficina estadísticas de la región representada por el laboratorio de ciencia de datos Del Inegi en particular destacamos que el doctor Villaseñor No presentó el trabajo de laboratorio que aborda dígito aspectos de la gestión y la utilización de
los datos desde la mera técnica informática hasta aspectos relacionados con la gestión del conocimiento la generación de capacidades tanto a nivel de infraestructura ti seguridad administración de redes de riesgos etcétera todo muy bien expuesto en Conjunto con las aplicaciones prácticas de Inteligencia artificial percepción remota y de imágenes nuevamente doctor Villaseñor Muchas gracias por su presentación a continuación tengo el gusto de presentar a ustedes al doctor Vladimir Miranda quien nos expondrá la experiencia de Liv y de Brasil en el uso del web scrapping y datos web para las estadísticas de precio El doctor Miranda licenciado maestro
y doctor En estadística física ingresó al ibg en el año 2010 como estadístico en la coordinación de índices de precios del ibeyé coint donde trabaja desde entonces en la actualidad también es responsable del equipo de planeamiento conceptual que ha venido trabajando los problemas acerca del uso de fuentes alternativas para las estadísticas de precios también ha estado contribuyendo En los trabajos del tag Team de scanner Data de la división de estadística de Naciones Unidas y en El Regional de Italia ubicado también en Brasil como uno de los cuatro existentes a nivel mundial doctor Miranda dijo con
usted también de 15 minutos para realizar su ponencia y cuando reste los últimos tres también le avisaré para que pueda generar los los de su presentación por favor adelante Muchas gracias Jorge muy bien bien Ahora esta introducción bueno consiguen mirar mi pantalla se ve perfecto Sí escucha también bien entonces Muchas gracias por la invitación y por la oportunidad de hablarnos un poco de nuestro trabajo acá en ipg entonces voy a hablar un poco sobre nuestras experiencias con el uso de datos de web para las estadísticas Entonces es muy rápidamente la Estructura de la presentación voy
a hablar muy rápido sobre los índices de precios al consumidor en ipg la web como una fuente para estadística de precios y algunos ejemplos que estamos trabajando acá Entonces el índice de precios al consumidor en una estadística de precios que busca mensurar la variación de precios de una canasta de bienes de servicios y los componentes de estas canastas en general Son definidos por una encuesta de presupuesto familiares y también nos permite derivar los pesos de los componentes de tal canasta y estos estas informaciones en general son agrupadas en un sistema de clasificación acá en Brasil
en el cuatro niveles que de arriba para abajo incrementamos el nivel de homogeneidad de los componentes de cada etapas que es la clasificación en Brasil tenemos canastas Independientes para cada una de las áreas cubiertas por los índices y índices son producidos para cada uno de ese niveles y después agrupados para producción de índices nacionales entonces índices para diferentes poblaciones objetivo también son producidos entonces un punto importante que este nivel Más abajo es el nivel En lo cual tenemos pesos explícitos más bajo que es definir documento agregado elemental del sistema y abajo de él que Se
encuentran los productos para los cuales uno Busca los precios para producción de los ingleses de precios y en este nivel alguna fórmula de agregación de los precios es utilizada para producción de los índices elementales Entonces es muy importante tener esto en cuenta cuando se intenta utilizar fuentes alternativas porque puede ser necesitar cambios importantes en esta estructura y nuestra Metodologías acá entonces en Brasil como en otros países del mundo se están buscando utilizar otras fuentes alternativas para la producción de índices de precios una de ellas es la web que es una fuente muy importante porque en
los si uno va a un sitio de comer se puede encontrar informaciones ricas sobre las descriptores del producto la descripción precios y además informaciones ricas sobre atributos de Productos entre otros entonces otro factor importante para intentar utilizar la web es que bajo la información que se presentan de manera amigable por un browser está un código html como este acá donde las informaciones están contenidas en este formato en las tardes en un formato de árbol bueno Esto es un factor muy importante porque se puede producir programas que también puede accesar la acceder a la información del
Sitio web que extraer datos de interés entonces este tipo de herramientas es conocida como web striped y es una herramienta muy poderosa pues permite tres datos de una manera muy eficiente en gran cantidad gran velocidad entonces hay diferentes tipos de aplicaciones que se pueden intentar que pueden tener más o menos impactos o cambios en tu la estructura de los indicadores de precios pero una de las aplicaciones más inmediatas es intentar Por ejemplo automatizar la colecta de precios para sectores cuales la colecta ya hecha de en forma manual en sitios web Entonces ese es el caso
por ejemplo en Brasil para los billetes de avión donde manualmente un proceso se constituye de dos etapas principales en que los recolectores han tenido que ir a los sitios web y informar los inputs de que define un viaje como el local de partido el local de llegada el tipo de billete de pasajero etcétera y después Extrae el precio que que retorna de los sitios en serie en el sistema Bueno de nuevo está desinformaciones con el precios el tipo de billetes etcétera se puede encontrar en medio a los códigos html y con eso nosotros acá intentamos
desarrollar un striper en un software para intentar automatizar estos procesos Y eso ha sido hecho acá como ustedes pueden ver los resultados de la coleta Automática si tuvieron éxito en Reproducir con un gran eficiencia y precisión los resultados de la colecta manual Entonces con eso nosotros conseguimos reducir la carga manual de millares de precios coletados los meses eso ha sido implementado de producción después ha sido expandido también para conexión de precios de billetes de avión para el programa de comparación internacional Otro punto por la cual el uso de datos de web puede ser útil Útil
es para introducir nuevos elementos en la canasta del ipc es también producir medidas más precisas de estos componentes Entonces nosotros nos defrontamos por eso en el con el surgimiento del servicio de viajes por app en nuestra última canasta que se mostró representativo y varias áreas de Brasil es con un peso similar al detax y un punto importante acá era Que este tipo de servicio al contrario de tags tiene un componente Dinámico de precios que hace con que el precio del servicio cambie rápidamente de acuerdo con la la demanda por por conductores y la oferta de
conductores Entonces si uno intenta hacer un proceso similar al de taxes y usar una tarifa estándar solo considera el dolor componente fijos los componentes nosotros no ponemos capital esta dinámica y tampoco capital Diferencias regionales entonces la princesa acá de sitios web que permiten simular un viaje a partir de de inputs que define un viaje nos permitió también derivar un striper y que que tuviera la posibilidad de captar precios más próximos de la realidad y capitales tan dinámica y la desagregación regional entonces acá algunos resultados puede ver para los índices calculados para diferentes regiones del Brasil
y que consiguen Captar la dinámica de precios del tiempo bueno otro punto importante que la datos web nos permiten o ofrece una oportunidad para mejorar metodologías existentes por ejemplo un problema clásico que es el de la gestión de ajustes de calidad para índices de precios y sectores como los electrodomésticos y electrónicos de ese problema surge debido a la el tiempo de vida de productos en el mercado un producto viejo puede salir de Mercado y un nuevo puede aparecer y en algunos casos por ejemplo institutos de estadísticas intentan sustituir el producto viejo por un nuevo y
Puede ocurrir que estos productos tengan características diferentes Y si uno intenta por ejemplo calcular el relativo de precio directamente Puede ocurrir de sesgos de ocurrir debido a diferencias de calidad entonces una manera de intentar tratar eso la herramienta estándar es la Utilización de modelos de regresión de idónicos entonces hay diferentes tipos de modelos Pero la idea es que uno intenta por ejemplo descomponer el precio del producto como una función de sus atributos y con eso uno puede por ejemplo producir un factor de corrección por el producto antiguo expresado en términos de las características del producto
nuevo y deducir un relativo de precios que Pueda ser libre de captar puramente la variación de presos entonces una limitación una de las primeras limitaciones para producir este tipo de de indicador es que es costoso conseguir informaciones sobre los atributos de los productos de forma manual Pero ahora con la web uno puede extraer estas informaciones con gran precisión de manera fácil formando un banco de atributos que permite Derivar modelos cetónicos para los productos entonces con un ejemplo del modelo derivado utilizando datos de web para refrigeradores estamos a un estudiando eso porque como os digo a
diferentes modelos que se pueden utilizar otro sector le quedan tres minutos tres y mi reloj Bueno voy a intentar acá el sector de altos también es algo que Estamos estudiando acá debido a la existencia de market places que permiten tener informaciones de coches siendo de precios de coches de características de coches en varias regiones de Brasil en uno solo lugar entonces eso también es algo que estamos estudiando otras aplicaciones que van a la ley del índice de precios al consumidor el programa de comparación internacional que busca Producir Los indicadores de poder de paridad de compras
se utiliza de un conjunto de productos bienes de servicios enviados a los países que tienen que intentar Buscar precios para esos entonces típicamente lo que se tiene es información de un catálogo el detalle de los productos que se buscan en una lista de productos y acá estamos explorando el uso de sitios comparadores de precios para los cuales nosotros primero formamos una lista objetivos con Algunos productos que estamos buscando estos esa lista es alimentan los motores de búsqueda de los sitios de manera automática y después extrae los resultados que que parecen de esta consulta Entonces es
un proceso que aún necesita de una validación semiautomática porque por ejemplo si uno Busca piña la fruta puede venir además de piña piña deshidratada o jugo de piña entonces intentamos por ejemplo automatizar un poco este proceso Utilizando palabras clave para filtrar los resultados Entonces por ejemplo tenemos un archivo con las palabras que el producto debe contener o excluir o muy rápidamente para encerrar otro proyecto más ambicioso que iniciamos una colaboración con investigadores de la universidad Federal tribunales fue intentar producir un escritor genérico que intenta percurrir varias etapas desde las descubierta de sitio web para los
sitios que están en nuestro muestro Hasta generar términos de consultas similar a los productos que tenemos en el nuestro hasta una interfaz para permitir la validación y evaluación de los resultados entonces muy rápidamente que se intentó utilizar un app de jugo para localizar los locales de nuestro después los locales son adicionados a la descripción de los productos que tenemos en el nuestro las descripciones originales son trabajadas Para son los motores de búsqueda de los sitios después los los resultados de la html sobre trayeros y se usan técnicas del lenguaje natural para intentar filtrados productos más
próximos de nuestro nuestro los resultados se presentan en una interfase que como está acá Bueno eso está aún a un desarrollo y finalmente para encerrar apenas para el embrales que están disponibles De un curso administrado por nuestros colegas inclusivos divinos Santos sobre usos de Watch de precios muchos de las aplicaciones acá pueden ser derivadas de contenido de este curso Muchas gracias Muchas gracias a usted doctor Miranda por su interesante presentación en donde celebramos conocer los avances de la utilización de webs gratis y los datos web para las estadísticas de precios del idj con aplicaciones concretas
en los viajes turísticos los tickets aéreos Servicios de viaje por Apps y con las consideraciones hedónicas a través del tiempo útiles para los electrodomésticos electrónicos automóviles usados en complemento también a otros desarrollos muy útiles y complementarios como aquel desarrollado para el cálculo del curso sin Power party y los avances en un algoritmo genérico de webs gratis ahora bien junto con agradecer nuevamente la presentación del doctor Miranda corresponde dar la oportunidad para Atender algunas consultas que no han ido dejando los asistentes en el Canal de chat que vamos y dirigiendo en función de la naturaleza de
la pregunta a cada uno de los ponentes pero también en en según corresponda No es cierto para dejarlo abierto también para cada uno de ellos En la medida que lo considere relevante una primera consulta que la voy a fundir con una pregunta que hacen desde nuestro Equipo del INE de chile es qué tan confiable son los datos que provienen del big Data y como ello eventualmente obliga a modificar los marcos de aseguramiento de la calidad en la producción estadística en la integración de esta multiples Fuentes esta pregunta la dejo abierta para cada uno de los
tres presentadores no sé quién quiere tomar primero la la palabra para dar respuesta a esta primera consulta Jorge yo puedo plantar un poco un poco un poquito al respecto bueno cuán bueno son las estadísticas esa es eso me pregunta muy importante porque como Big Data es una fuente a las estadísticas que son generales dependen de cómo son procesadas las informaciones Y de qué es el objetivo de la estadísticas Así que como comentamos ahora por ejemplo en la presentación de Vladimir hay si no se cuida con el tipo De aplicación es posible generar sesgo una situación
muy común por ejemplo es imaginar que una estadística por ejemplo de tweet como comentóreo se queda si se puede extrapolar para todo para toda una población población esa es una cuestión que que debe tener muy cuidado porque es para la población de tweets Vale entonces hay que tener muy Cuidado con la la cualidad de la información pero eso no es una característica del Es una fuente de información la caracteriza es como nosotros utilizamos esa estadística y con qué objetivos Vale entonces Esa es mi contribución perfecto muchas gracias profesor por su intervención Vladimir y finalmente le
quedó la palabra a helio dado que la aplicación es directa en términos de la modificación del aseguramiento de la calidad con el Inegi pero anteriormente le quiero quiero conocer la palabra del Doctor Miranda Bueno yo creo que lo como lo dijo cristiano los datos ellos son confiables Pero uno uno tiene que conocer Cuáles son las limitaciones o no los datos y cuáles son los impactos metodológicos que que uno puede tener para su utilización Entonces por ejemplo en el caso más específico de índice de precios no estemos dos fuentes principales Exploradas que son web datos de
web y es cambiar datos son Fuentes muy ricas pero que contienen informaciones con características diferentes entonces escáner Data nos trae por ejemplo informaciones de los pesos de los productos comercializados o la cantidad comercializada Entonces yo no intenta por ejemplo utilizar todos los datos que uno puede poner a esta información en la web en general notemos este tipo de información disponible si uno intentar Hacer uso sin cuidado puede generar riesgos por eso entonces lo que vas a hacer los datos confiables o no es que usted tiene que tener en cuenta Cuáles son las limitaciones de los
datos y cuáles son los cambios que necesitas hacer para usarlos perfecto doctor Miranda ahora le quiero dar también la palabra al doctor Villaseñor en particular en cómo los desarrollos Que han hecho en el laboratorio de licencia de datos del Inegi de México ha obligado a reconfigurar o estudiar o evaluar posibles cambios en el marco de aseguramiento de la calidad y también de Los indicadores con los cuales van midiendo las estadísticas basadas en los grandes o los macrodatos por favor doctor la palabra de usted Claro que sí muchas gracias Bueno lo primero que quisiera mencionar es
que las fuentes de Big Data no están pensadas en su origen Para generar estadística oficial no Entonces eso es algo que debemos tener en cuenta siempre que hagamos alguna aplicación de estilo Tenemos que tener en consideración todo lo que ya mencionaron mis colegas Respecto a los posibles sesgos y y bueno y y los factores de calidad por ejemplo hablando del caso de las imágenes satelitales sabemos que en nuestras regiones tropicales Pues hay una constante presencia de nubes en varias En varias partes y entonces pues las imágenes satelitales no tienen la calidad que quisiéramos en muchas
ocasiones para poder hacer este tipo de de experimentos de aplicaciones y entonces hay que tener también eso en consideración el ruido que trae la información es algo también inherente al al Big Data no es no es información que esté limpia a priori entonces Muchas veces es necesario generar procesos de limpieza De información y bueno en el caso particular de las aplicaciones que estamos realizando Pues en realidad no no ha implicado un cambio en la calidad o sea nosotros los productos que generamos debemos de tener la calidad que que el Inegi nos nos impone no esto
O sea la calidad no debe ser este comprometida para que se adecue al Big Data sino el Big Data debe de llegar a esos niveles de calidad en particular en el ejemplo que mostré de codificación Automática cuando dije Cuando digo que se puede sustituir un 50% de la fuerza laboral aprovechando Inteligencia artificial es porque se mantiene la calidad de que se tiene actualmente en la codificación O sea no se compromete no se compromete la calidad no entonces son mis comentarios Muchas gracias perfecto pero en esta misma línea doctor si bien Obviamente el estándar no se
ve modificado independiente de las fuentes de datos que utilizamos para la Producción estadísticas oficiales puede dar lugar por ejemplo a que se generen nuevos indicadores atendía esta nueva fuente de datos con la cual obviamente vamos a realizar nuestra misión institucional eso estamos Cómo ha sido abordado por el lado desde claro desde el Inegi sí del Inegi este bueno actualmente tenemos productos que son productos este estadísticas experimental como es el ánimo tuitero eso es un es nuestro primero pero también tenemos por Ejemplo el índice el Now casting de la actividad económica que es el índice oportuno
de la actividad económica ese índice se adelanta seis semanas a la estadística oficial y es y bueno tiene su su Rango de error Entonces se realiza al usuario es una estadística experimental tiene tiene este nivel de error porque esa es una estimación basada en en fuentes alternativas y bueno no sustituye la estadística Oficial se adelanta es un indicador que se adelanta pero hay que tener en cuenta que no no no lo sustituye no pero cada información muy valiosa si tenemos un Rango de error es suficientemente pequeño claro perfecto doctor y esta pregunta me imagino que
también te dirige a usted en el caso del icase usted utilizan imágenes satelitales del libre disposición o son imágenes pagadas bien muchas gracias por la Pregunta sí todas las imágenes del q datos que espaciales son imágenes lanzar que son este totalmente gratuitas nosotros lo que lo que tenemos es que las hemos bajado todas para poder generar estos productos nacionales estos Entonces estamos a tenerlas nuestra nuestro propio archivo de imágenes lanzar para poder hacer este tipo de productos Muchas gracias doctor ahora voy a fundir un par de preguntas que están orientadas Al doctor Miranda delivillé que
creo que ya no anticipó algo en su intervención en la primera gran pregunta si existían mejor hacer la metodología para la recolección de precios en las aerolíneas y también que la Quiero unir con la pregunta de nuestra colega Denis López de línea de chile que si a la fecha para productos como electrodomésticos se recogen precios solo por huesos gratis o también se recogen precios bajos escáner Data tío De forma presencial y como estas fuentes de datos pueden o no ser ponderar de manera distinta Bueno entonces para el caso de las aerolíneas nosotros tuvimos necesidad de
cambios en la metodología porque solo cambiamos la forma de recolección de precios entonces la el cambio ocurrió ahí apenas son nosotros ganamos más eficiencia en el proceso sobre la pregunta de los Electrodomésticos entonces en producción hoy nosotros tenemos productos coletados físicamente principalmente y algunas algunas coletas manual en la web pero están estamos estudiando una paleta mayor vía web stripping y Tenemos también coletamos los atributos para los estudios que los cetónicos acerca de las otras fuentes Scanner Data a uno para los electrónicos y sobre uso de otras de de ponderadores nosotros estamos Estudiando acá una manera
de ponderar estas informaciones por ejemplo con informaciones de las encuestas de presupuestos o otras fuentes para intentar ponderar de manera indiferente perfecto muy amable doctor Miranda y como última consulta que también para modo de cierre la quiero orientar para dejarla abierta cada uno de los expositores hay una consulta o reflexión asociado a cuál es el rol que tiene los gobiernos locales como principales Sponsor y como prosimer en esta concepción de proveedor de datos pero también de consumidor de los datos asociado a los proyectos de Big Data cualquiera de ustedes basado en su conocimiento que ha
sido el papel de los gobiernos locales como promotor o como usuarios de estos proyectos de Big Data le quiero dar en primera instancia la palabra al profesor serraz luego siguiendo el mismo orden anterior al doctor Miranda y finalmente también al Doctor Villaseñor profesor la palabra de usted Gracias Jorge Bueno yo puedo hablar un poco a partir de mi experiencia no soy profesor de la universidad Federal de Perú y actuó y muestreo aplicado agricultura y el factor de Dios está aquí es es Es iniciativa del gobierno a partir del ipg que me inventó y empezó la
universidad Federal de pernambuco así como por ejemplo hay parcerías hay colaboraciones Específicas incópicos de estudios Vladimir por ejemplo mencionó la pasaría con la ufmg Entonces yo creo que la iniciativa del Hub de Brasil en que hay la invitación de otros actores importantes no solo de la de los institutos de estadísticas también de las universidades Son son un paso Un ejemplo muy importante radiación en la dirección de fomentar el estudio respecto del tema perfecto muchas gracias Doctor Miranda la palabra de usted Bueno yo creo que hay si un esfuerzo vocal local principalmente del pg digamos ahora
más con el Hub de intentar coordinar los trabajos de producción del Sistema estadístico Nacional pero no es una tarea muy fácil una de las iniciativas que tenemos en cantar por ejemplo tener más acceso a los registros administrativos de públicos entonces y hacer como digo cristiano parcerías Con diferentes niveles de productores de de estadísticas o de datos de acá a nivel municipal Sandoval etcétera el ipg siempre tuvo demandas del gobierno para producción de estadística y esto continúa ocurriendo y creo que va así intensificar más con ahora con madera de la habilidad de ciencias de datos entonces
juntamente con el jarabe o tres Iniciativas estamos tratando fortalecer acá la institución para poder generar este tipo de servicios de información Muchas gracias por su intervención doctor Miranda y para terminar la respuesta o esta reflexión la de la palabra al doctor Díaz Señor por favor muchas gracias Jorge sí Bueno yo creo que el impulso de esta de este aprovechamiento de fuentes alternativas Lo tenemos también en nuestro plan estratégico del Sistema Nacional de información estadística y geográfica en donde está claro que que esta es una parte esencial que atiende la necesidad de modernización del del en
la generación de información más más oportuna más desagregada y entonces pues sí de alguna manera eso eso nos está este impulsando y promoviendo para para nuestro trabajo no es es un plan estratégico a mediano y largo plazo Entonces con esa Mira pues es que estamos también tomando iniciativas perfecto muchas gracias doctor Díaz Señor por su por su intervención y reflexión dicho esto bueno Y como palabra cierre agradecemos cada uno de ustedes tanto los presentadores como también la audiencia Que terminamos con cercanos al mismo número de las 300 personas que originalmente se conectaron por la por
la participación las Consultas y desde ya como rtc lo dejamos invitados para la próxima videoconferencia en la cual trataremos el uso de datos móviles para las estadísticas de inmigración la que se realizará Durante este mes de diciembre Les informamos que el link de registro para esta próxima videoconferencia será enviado su correo electrónico y en caso de requerir el envío de las invitaciones adicionales puede también escribir escribirnos al correo
[email protected] Esperamos que la temática que revisamos hoy en día con estas aplicaciones prácticas signifiquen un aspecto motivante para la oficina estadística y también para visualizar el tremendo
trabajo que ha estado realizando el Data have de Brasil uno de los cuatro a nivel mundial y que también nos acerca el término regionales a disponer del apoyo para trabajar de manera conjunta en la utilización para Propósitos estadístico de estas distintas fuentes de datos Así que con esto Me despido y espero que haya sido de utilidad para todas y todos los contenidos vistos en esta audiencia que esté muy bien gracias saludos a todos Muchas gracias por el espacio