Como parte de nuestra investigación, monitorizamos periódicamente GitHub para entender qué está ganando tracción y popularidad dentro de la comunidad, utilizando las estrellas (número de “stars” del proyecto) como indicador.
En mayo de 2022, nuestro análisis de los 25 repositorios con más estrellas reveló algunas tendencias sorprendentes. En particular, la prominencia de proyectos que no están directamente relacionados con el desarrollo de software. En ese trabajo, analizamos los proyectos en base a las seis categorías principales previamente identificadas según el contenido del proyecto: software, awesome list, libros, plan de estudio, colección de algoritmos y guías de estilo. Puedes consultar nuestra publicación anterior para una descripción de las categorías.
Ahora hemos repetido el análisis, utilizando las mismas categorías. Y hemos observado algunos cambios interesantes. La siguiente figura muestra la distribución de estas categorías para los 25 repositorios con más estrellas en GitHub:
La lista de repositorios se puede consultar aquí.
Nuestra sorpresa fue que, aunque los proyectos de desarrollo de software siguen teniendo una presencia significativa, su protagonismo ha disminuido frente al notable crecimiento de los awesome lists y los syllabus / planes de estudio. Los awesome lists y los planes de estudio suelen centrarse en documentación y recursos educativos, lo que resalta el papel cada vez mayor de GitHub como una entorno para el intercambio colaborativo de conocimiento.
Otros aspectos destacados, en comparación con nuestro último análisis, son:
- Vemos una nueva incorporación del mundo de la IA en posiciones top, con AutoGPT. Junto con Tensorflow, representan a la comunidad de IA en la categoría de software, que está ganando relevancia (2 de 8). Podemos esperar en el futuro la entrada de nuevos proyectos de IA en el top 25, como Transformers o Ollama (actualmente en los puestos 34 y 36, respectivamente).
- No hay ningún proyecto de software en el top 10. El top 10 lo formna las awesome lists (5), planes de estudio (4) y un proyecto de libros. Así, vemos la importancia del rol social de GitHub más allá del código. Este tipo de proyectos, sobretodo las awesome lists, son mantenidos por la comunidad, añadiendo o eliminando elementos de una lista.
- Los proyectos en chino siguen siendo los únicos proyectos no ingleses que vemos en el top 25, como CyC2018/CS-Notes, manteniendo su importancia en la plataforma. También hay un proyecto no relacionado con código, libros o guías, sino con la labor de programar. Se trata de 996.ICU, utilizado para rastrear empresas que aún aplican el abusivo horario laboral conocido como 996 (9 a.m.–9 p.m., 6 días a la semana). Así, incluso vemos GitHub siendo utilizado como una plataforma de construcción de comunidad, donde las personas comparten sus preocupaciones sobre prácticas relacionadas con el desarrollo de software.
De esta revisión, podemos ver que las conclusiones de nuestra publicación anterior siguen vigentes. Principalmente que la transformación de GitHub en una plataforma social para esfuerzos colaborativos más allá del código es evidente. Repasando nuestras conclusiones previas:
- De esta revisión, queda claro que la presencia de proyectos que no son software en GitHub sigue creciendo. Esta tendencia puede afectar significativamente los esfuerzos de la comunidad de minería de software, que depende del análisis masivo de datos o de muestras representativas para extraer información relevante. A medida que los repositorios no relacionados con software se vuelven más prevalentes, los investigadores deberán extremar las precauciones para filtrar proyectos irrelevantes y así asegurar la precisión y relevancia de sus hallazgos.
- Vemos algunos proyectos que consiguen sobrevivir financieramente (vía patrocinio o infraestructura externa como open collective o patreon), asegurando su sostenibilidad a largo plazo. Y seguimos pensando que tener modelo de gobernanza transparente para dejar claro cómo se gestionará la inversión y quién puede beneficiarse de ella, especialmente sabiendo que los usuarios no técnicos tienen un papel cada vez más clave en estas comunidades y sus sostenibilidad futura, pero esto ya es más una opinión que un análisis científico.
A medida que GitHub sigue evolucionando, seguiremos atentos a estas tendencias para evaluar la dirección del uso de la plataforma. ¡Os iremos informando!
Últimos comentarios