Diseño de implementación y evaluación de un clúster Beowulf en el Departamento de Estadística de la División de Ciencias Forestales de la Universidad Autónoma Chapingo/ por Jorge Omar Carrillo Martínez; director de tesis Israel Lerma Serna; secretario Angel Leyva Ovalle; vocal Antonio Villanueva Morales; suplente Carlos Leopoldo Cintora González; suplente Alejandro Corona Ambris
Material type:
TextPublisher: Chapingo, México : El autor, 2024Description: 1 recurso en línea (70 páginas): cuadros, figurasContent type: - texto
- computadora
- recurso en línea
| Cover image | Item type | Current library | Home library | Collection | Shelving location | Call number | Materials specified | Vol info | URL | Copy number | Status | Notes | Date due | Barcode | Item holds | Item hold queue priority | Course reserves | |
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| Tesis digital | Biblioteca Digital En línea | Tesis digitales de Licenciatura | Tesis digital (Browse shelf(Opens below)) | Available (Préstamo interno) |
Licenciatura en Estadística División de Ciencias Forestales, 2024. Licenciatura
Incluye referencias bibliográficas: páginas 63-64.
La creciente generación de grandes conjuntos de datos que deben ser analizados requieren de un gran poder computacional. Los equipos comerciales individuales no son suficientemente potentes como para cumplir con la tarea. Afortunadamente, se han desarrollado tecnologías como los clústeres Beowulf que consisten en la agrupación de computadoras mediante una red para reunir recursos computacionales con la condición de buscar el mejor desempeño al menor costo. Por lo que se usan productos comerciales y software libres o de código abierto. El presente proyecto pretende servir de guía para la construcción de un clúster Beowulf con fines científicos. Con el propósito de verificar que las instrucciones son correctas, se implementaron las instrucciones usando equipo disponible en el laboratorio de cómputo de la División de Ciencias Forestales. Se usó Linux por su flexibilidad y R por ser el programa destinado al análisis de datos en la carrera de estadística de la Universidad Autónoma Chapingo. También se requirió de un programa encargado de coordinar las computadoras en R. La solución fue usar la librería Rmpi que es una interfaz de una implementación de Message Passing Interface (MPI). El objetivo de Rmpi es portear funciones de bajo nivel de MPI a R para que los usuarios no requieran conocer C o Fortran. Con 5 computadoras, una red ethernet, SSH, NFS, OpenMPI y Rmpi se conformó un clúster Beowulf que funciona disminuyendo los tiempos de ejecución de código en R y que sirve para las actividades que los estadísticos desempeñan. Mediante tal clúster se obtuvo una disminución del tiempo de casi la mitad cada vez que se agregaba el doble de núcleos para procesar una tarea que se paraleliza fácilmente. Se muestra un script de una regresión lineal simple que se ejecuta paralelamente y que es un ejemplo de uso del clúster Beowulf por parte de estadísticos.
There are no comments on this title.
