Generación distribuida de grafos con Hadoop - MapReduce

datacite.contributor.advisorAngles Rojas, Renzo
datacite.contributor.coguiaParedes Moraleda, Rodrigo
datacite.contributor.entityUniversidad de Talca
datacite.creatorLópez Gallegos, Fernanda Soledad
datacite.date.issued2020
datacite.rightsAcceso Abierto
datacite.size94 p.
datacite.titleGeneración distribuida de grafos con Hadoop - MapReduceen_US
datacite.titleGeneración distribuida de grafos con Hadoop - MapReduce
dc.date.accessioned2022-04-29T14:50:09Z
dc.date.available2022-04-29T14:50:09Z
dc.description94 p.en_US
dc.description.abstractLos grafos son una herramienta muy utilizada debido a su gran capacidad de modelar redes complejas. Desafortunadamente, encontrar conjuntos de datos representativos de la realidad, es un problema para muchos profesionales de diversas áreas. Esto, ha motivado la construcción de herramientas que permitan generar grafos de manera artificial. En ese sentido, R3MAT es un método diseñado para producir grafos sintéticos cuyas características se asemejan a las que ocurren en el mundo real (ej. distribución de ley de potencia). A pesar de su buen desempeño en comparación con otros generadores, R3MAT tiene problemas para generar grafos de muy gran tamaño. Además, el grafo más grande que se puede generar, se encuentra limitado por la cantidad de datos que se puedan gestionar en la memoria principal de un computador. En este trabajo se estudian variantes distribuidas basadas en R3MAT, con el objetivo de disminuir el tiempo de ejecución y al mismo tiempo soportar la generación de grafos más grandes que R3MAT. Para ello, se diseñan e implementan métodos usando Hadoop - MapReduce, los cuales posteriormente son evaluados en términos de eficiencia (tiempo de ejecución), escalabilidad (tamaño del grafo) y realismo (ley de potencia). Los resultados obtenidos muestran que: (i) para grafos con m as de diez millones de nodos, los nuevos métodos (distribuidos) son más rápidos que R3MAT (secuencial), (ii) los nuevos métodos soportan la generación de grafos m as grandes que el método secuencial, (iii) los grafos producidos con los nuevos métodos presentan la propiedad de distribución de ley de potencia, y (iv) los nuevos métodos son mejores que los métodos distribuidos que se encuentran en el estado del arte, en el sentido que: presentan un mejor ajuste a una distribución de ley de potencia, permiten diferenciar la generación de un grafo dirigido de uno no dirigido, y aseguran la producción de una cantidad determinada de aristas, sin generar aristas repetidas.en_US
dc.description.abstractLos grafos son una herramienta muy utilizada debido a su gran capacidad de modelar redes complejas. Desafortunadamente, encontrar conjuntos de datos representativos de la realidad, es un problema para muchos profesionales de diversas áreas. Esto, ha motivado la construcción de herramientas que permitan generar grafos de manera artificial. En ese sentido, R3MAT es un método diseñado para producir grafos sintéticos cuyas características se asemejan a las que ocurren en el mundo real (ej. distribución de ley de potencia). A pesar de su buen desempeño en comparación con otros generadores, R3MAT tiene problemas para generar grafos de muy gran tamaño. Además, el grafo más grande que se puede generar, se encuentra limitado por la cantidad de datos que se puedan gestionar en la memoria principal de un computador. En este trabajo se estudian variantes distribuidas basadas en R3MAT, con el objetivo de disminuir el tiempo de ejecución y al mismo tiempo soportar la generación de grafos más grandes que R3MAT. Para ello, se diseñan e implementan métodos usando Hadoop - MapReduce, los cuales posteriormente son evaluados en términos de eficiencia (tiempo de ejecución), escalabilidad (tamaño del grafo) y realismo (ley de potencia). Los resultados obtenidos muestran que: (i) para grafos con m as de diez millones de nodos, los nuevos métodos (distribuidos) son más rápidos que R3MAT (secuencial), (ii) los nuevos métodos soportan la generación de grafos m as grandes que el método secuencial, (iii) los grafos producidos con los nuevos métodos presentan la propiedad de distribución de ley de potencia, y (iv) los nuevos métodos son mejores que los métodos distribuidos que se encuentran en el estado del arte, en el sentido que: presentan un mejor ajuste a una distribución de ley de potencia, permiten diferenciar la generación de un grafo dirigido de uno no dirigido, y aseguran la producción de una cantidad determinada de aristas, sin generar aristas repetidas.
dc.formatapplication/pdf
dc.identifier.otherIngeniería Civil en Computación.
dc.identifier.urihttps://repositorio.utalca.cl/repositorio/handle/1950/12733
dc.languageesen_US
dc.languageEspañol
dc.placeofeditionCuricó
dc.publisherUniversidad de Talca (Chile). Escuela de Ingeniería Civil en Computación.en_US
dc.publisherUniversidad de Talca (Chile). Escuela de Ingeniería Civil en Computación.
dc.subject.categoryCiencias de la Computación
oaire.licenseConditionhttps://creativecommons.org/licenses/by-nc-nd/4.0/
oaire.licenseCondition.urihttps://creativecommons.org/licenses/by-nc-nd/4.0/
oaire.resourceTypeTesisen_US
oaire.resourceTypeTesis
utalca.informaciondegeneroMujer
utalca.odsN/A
Files
Original bundle
Now showing 1 - 3 of 3
Thumbnail Image
Name:
índice_lópez_gallegos.pdf
Size:
126.48 KB
Format:
Adobe Portable Document Format
Description:
Tabla de contenidos
Thumbnail Image
Name:
resumen_lópez_gallegos.pdf
Size:
99.34 KB
Format:
Adobe Portable Document Format
Description:
Resumen
Thumbnail Image
Name:
2020A000493.pdf
Size:
1.57 MB
Format:
Adobe Portable Document Format
Description:
Link a texto completo
License bundle
Now showing 1 - 1 of 1
Thumbnail Image
Name:
license.txt
Size:
1.8 KB
Format:
Item-specific license agreed upon to submission
Description: