dc.rights.license | https://creativecommons.org/licenses/by-sa/2.5/ar/ | es_AR |
dc.contributor.advisor | Roccatagliata, Pablo | es_Ar |
dc.contributor.author | Barbagallo, Lionel Alberto | es_AR |
dc.coverage.spatial | Argentina | es_AR |
dc.date.accessioned | 2022-08-26T22:18:25Z | |
dc.date.available | 2022-08-26T22:18:25Z | |
dc.date.issued | 2021 | |
dc.identifier.uri | https://repositorio.utdt.edu/handle/20.500.13098/11276 | |
dc.description.abstract | Durante los últimos años ha ganado impulso el movimiento de gobierno abierto, que busca transparentar la administración, acercando el Estado a la ciudadanía, pero también abriendo repositorios de información con el fin de favorecer el avance del conocimiento en diversas áreas de investigación. En este contexto, diversos actores del poder judicial en la Argentina han implementado programas de apertura de datos, entre ellos el Juzgado Penal, Contravencional y de Faltas N° 10 de la Ciudad Autónoma de Buenos Aires. No obstante, estas iniciativas de democratización de los datos y del conocimiento chocan con un desafío: el de la privacidad de los individuos. Dada la gran expansión de Internet, el incremento en el acceso a nuevos y masivos conjuntos de datos y en el poder de cómputo y tecnología de manipulación de los datos; las técnicas y enfoques tradicionales de protección de la privacidad resultan insuficientes. Para superar estas amenazas a la privacidad en la implementación de su programa de datos abiertos, estaremos colaborando con el Juzgado N° 10 a fin de proponer una estrategia de apertura de datos capaz de garantizar elevados estándares de privacidad a los individuos. Al finalizar este trabajo, realizaremos una propuesta alternativa al flujo de trabajo actualmente utilizado por el Juzgado. Para ello, nos valdremos de una novedosa técnica llamada Differential Privacy, que permite llevar adelante la distribución de conjuntos de datos, pero controlando la cantidad de información privada que se deja filtrar. | es_AR |
dc.description.abstract | In recent years, the open government movement has gained momentum. This movement aims to make the administration transparent, bringing the State closer to the citizenry, but also opening information repositories in order to promote the advancement of knowledge in various research areas. In this context, various actors of the judiciary system in Argentina have implemented data opening programs, including Criminal, Misconduct and Misdemeanor Court No. 10 of the Autonomous City of Buenos Aires. However, these initiatives to democratize data and knowledge come up against a challenge: that of individual privacy.
Given the great expansion of the Internet, the increase in access to new and massive data sets and in the computing power and data manipulation technology; traditional privacy protection techniques and approaches are insufficient. To overcome these threats to privacy in the implementation of its open data program, we will be collaborating with Court No. 10 in order to propose a data opening strategy capable of guaranteeing high privacy standards for individuals. At the end of this work, we will make an alternative proposal to the workflow currently used by the Court. To do this, we will use a new technique called Differential Privacy, which allows us to carry out the distribution of data sets, but controlling the amount of private information that is allowed to be leaked. | en |
dc.format.extent | 127 p. | es_AR |
dc.format.medium | application/pdf | es_AR |
dc.language | spa | es_AR |
dc.rights | info:eu-repo/semantics/openAccess | es_AR |
dc.subject | Derecho a la privacidad | es_AR |
dc.subject | Administración Pública | es_AR |
dc.subject | Privacidad de los Datos | es_AR |
dc.title | Un nuevo enfoque de Privacidad de los Datos aplicado a resoluciones judiciales | es_AR |
dc.type | info:eu-repo/semantics/masterThesis | es_AR |
dcterms.description.tableOfContents | Introducción: Gobierno Abierto y Privacidad P.1; Política de datos abiertos en Juzgado Penal, Contravencional y de Faltas N°10 de la Ciudad de Buenos Aires P.1; Objetivos del trabajo: colaboración con el Juzgado N° 10 en su estrategia de datos abiertos P.3; Estructura del trabajo P.3; Parte I. Marco teórico P.5; 1.1. Problemas en torno a la privacidad P.7; 1.1.1. ¿Qué entendemos por privacidad? P.7; 1.1.2. Riesgos a la privacidad en la era del ‘big data’ P.8; 1.1.3. Ataques sobre la privacidad P.10; 1.1.4. Las leyes de protección de la privacidad P.13; 1.2. Privacidad y acceso a los datos en la justicia P.15; 1.2.1. El acceso a la información judicial en la Argentina y el mundo P.15; 1.2.2. Riesgos a la privacidad en las estrategias de datos abiertos del Juzgado N° 10 P.17; 1.3. Differential Privacy P.20; 1.3.1. Una técnica de protección de la privacidad: Differential Privacy P.20; 1.3.2. Definiendo Differential Privacy P.21; 1.3.3 La sensibilidad de un mecanismo de Differential Privacy P.23; 1.3.4. Los mecanismos de Differential Privacy P.28; 1.3.4.1. El mecanismo laplaciano P.29; 1.3.4.2 El mecanismo gaussiano P.29; 1.3.4.3. Comparativa de los mecanismos laplaciano y gaussiano P.31; 1.3.5. Registros correlacionados y Group Privacy P.34; 1.3.6. Composición P.35; 1.3.6.1. Consultas secuenciales y paralelas P.36; 1.3.6.2. Composición simple P.37; 1.3.6.3. Composición avanzada P.37; 1.3.7. Medidas de calidad de la información P.39; 1.3.8. Propiedades de Differential Privacy P.41; 1.4. Differential Privacy en la práctica P.42; 1.4.1. Differential Privacy para la recopilación de datos P.42; 1.4.2. Differential Privacy para el machine learning P.44; 1.4.2.1. Private Aggregation of Teachers Ensembles P.44; 1.4.2.2 Differentially Private Stochastic Gradient Descent P.46; 1.4.3. Differential Privacy para Data Analysis y Data Publishing P.47; 1.4.3.1. Data Analysis P.47; 1.4.3.2. Data Publishing - Datasets Sintéticos P.47; 1.4.3.3. Data Publishing - Tablas de Contingencia P.49; 1.4.3.4. Data Publishing - Histogramas - Tablas de distribución de frecuencias P.50; 1.5. El ecosistema tecnológico en torno a Differential Privacy P.51; Parte II. La implementación de la solución P.53; 2.1. El mecanismo propuesto P.56; 2.1.1. Las modalidades de presentación de la información P.56; 2.1.1.1. Datasets sintéticos P.56; 2.1.1.2. Tablas de contingencia P.57; 2.1.1.3. Histogramas - Tablas de distribución de frecuencias P.59; 2.1.2. Completando el setting inicial P.61; 2.1.3. Las herramientas a utilizar P.61; 2.2. Explorando el dataset P.63; 2.2.1. La estructura del dataset - Preselección de atributos P.64; 2.2.2. Análisis de registros correlacionados P.69; 2.2.3. Partición del dataset P.73; 2.3. Análisis e ingeniería de atributos P.75; 2.3.1. Cardinalidad de la variable y calidad de la información P.75; 2.3.2. Ingeniería de atributos para el set de datos I P.76; 2.3.2.1. Atributos con valores missings y de poca varianza P.76; 2.3.2.2. Combinación de atributos P.77; 2.3.2.3. Análisis y restructuración de la cardinalidad de las variables P.79; 2.3.2.4. Evaluación de las transformaciones introducidas P.81; 2.3.3. Ingeniería de atributos para el set de datos II P.82; 2.3.3.1 Atributos con valores missings y de poca varianza P.82; 2.3.3.2. Combinación de atributos P.83; 2.3.3.3. Análisis y restructuración de la cardinalidad de las variables P.85; 2.3.3.4. Evaluación de las transformaciones introducidas P.86; 2.4. Comparación de mecanismos de Differential Privacy P.88; 2.4.1. Revisitando el concepto de Differential Privacy P.88; 2.4.2. Tratamiento de inconsistencias en las tablas de distribución de frecuencias P.89; 2.4.3. Evaluación de mecanismos de Differential Privacy sobre el set de datos I P.93; 2.4.4. Evaluación de mecanismos de Differential Privacy sobre el set de datos II P.96; 2.5. Definiendo los parámetros óptimos de los mecanismos de Differential Privacy P.100; 2.5.1. Problemas de asignación del presupuesto entre atributos P.100: 2.5.2. Optimización del presupuesto P.104; 2.5.2.1. Composición simple y avanzada P.104; 2.5.2.2. Análisis de sensibilidad del error mecanismo de Differential Privacy en función del presupuesto. Set de datos I P.105; 2.5.2.3. Consideraciones sobre los riesgos a la privacidad P.107; 2.5.3. Sensibilidad del error al tamaño del dataset P.108; 2.6. Recapitulando sobre la propuesta - Recomendaciones de cara a un MVP P.111; Conclusiones P.115; Acordadas judiciales de los tribunales superiores referidas en el trabajo P.117; Leyes referidas en el trabajo P.117; Bibliografía referida en el trabajo P.117; Anexos P.122 | es_AR |
thesis.degree.name | Master in Management + Analytics | en |
thesis.degree.grantor | Universidad Torcuato Di Tella | es_Ar |
thesis.degree.grantor | Escuela de Negocios | es_Ar |
dc.subject.keyword | Gobierno Abierto | es_AR |
dc.subject.keyword | Política de Datos Abiertos | es_AR |
dc.subject.keyword | Datasets | es_AR |
dc.subject.keyword | Differential Privacy | es_AR |
dc.type.version | info:eu-repo/semantics/acceptedVersion | es_AR |