Ejemplo de una posible historia con fuentes de la Web
Ejemplo de un ejercicio de lectura distante
Introducción al ejercicio
- El presentador menciona que desea compartir un ejercicio realizado hace aproximadamente dos años, el cual ha intentado retomar recientemente.
Metodología del ejercicio
- Se describe el ejercicio como una forma de "lectura distante", sugiriendo que es un método para analizar y explorar la historicidad de lo digital.
Enfoque en el ciberactivismo
- El enfoque principal del análisis es el concepto de ciberactivismo, que comenzó a desarrollarse en los años noventa y se masificó durante esa década.
Contexto histórico del ciberactivismo
- Se destaca cómo el activismo digital trasciende los métodos tradicionales, utilizando la web como nuevo canal para la difusión y lucha política.
La evolución de la web
- Se menciona que a principios del siglo XXI, la web era vista como un espacio más abierto y accesible, en contraste con su actual mercantilización.
Implicaciones globales del internet
- El internet permite involucrarse en luchas globales, transformando la percepción sobre problemas sociales y políticos.
Ciberactivismo: Un fenómeno digital
Definición y características
- El ciberactivismo se define como una forma independiente del activismo tradicional; puede existir sin necesidad de manifestaciones físicas.
Ejemplos históricos en Colombia
- Se presenta a Colombia como un caso específico donde surgieron medios alternativos digitales, comenzando con indymedia.org hacia 1999.
Creación de canales alternativos
- Indymedia generó canales regionales e internacionales para difundir información alternativa frente a los medios tradicionales controlados por intereses políticos.
Proyectos destacados
- Se menciona el movimiento zapatista en México como uno de los primeros ejemplos influyentes en la creación de indymedias regionales.
Medios independientes y resistencia
Espacios digitales alternativos
- Los medios independientes buscan ofrecer información no filtrada por las políticas editoriales dominantes, especialmente en contextos políticos restrictivos.
Colaboraciones significativas
- Se habla sobre "Periódico desde abajo" y su unión con "Proyecto Atarraya", ambos dedicados a difundir información alternativa mediante plataformas digitales.
Símbolos de resistencia
Centro de Medios Independientes: Historia y Funcionamiento
Orígenes y Desarrollo
- El Centro de Medios Independientes (Indymedia) surge en un contexto donde la web no era tan dinámica, permitiendo una participación activa en proyectos de comunicación a nivel global.
- Desde diciembre del 2000, se establecen múltiples proyectos bajo el nombre de "Centro de Medios Independientes", cada uno con su propia plataforma para la difusión de información.
- Utilizaban PHP como CMS, un software libre que se instalaba en servidores propios o proporcionados por Indymedia, facilitando la administración y actualización del contenido.
Infraestructura y Seguridad
- La infraestructura detrás de Indymedia es crucial; sin ella, el funcionamiento del centro no sería posible. Se enfatiza la importancia de garantizar la seguridad para los participantes.
- Los centros debían protegerse contra hackeos y ataques que pudieran comprometer la información, lo que llevó a formar grupos técnicos especializados en desarrollar esta infraestructura.
Contexto Histórico
- Indymedia se fundó en 1999 durante las luchas contra la Organización Mundial del Comercio (OMC), utilizando Internet como herramienta para contrarrestar movimientos anti-globalización.
- Este proyecto puede ser contextualizado dentro de otros movimientos históricos similares que han buscado crear espacios alternativos para la difusión de noticias.
Publicación y Participación
- A diferencia de medios tradicionales, Indymedia no tenía editores específicos ni números fijos; promovía una publicación abierta donde cualquier miembro podía contribuir directamente.
- Se implementó un sistema donde los artículos eran revisados antes de su publicación, permitiendo comentarios que enriquecían el debate sobre los temas tratados.
Interacción y Moderación
- La posibilidad de comentar fue fundamental desde sus inicios; esto permitió una interacción directa entre lectores y autores, creando un espacio único para el diálogo.
- Los comentarios eran moderados; aquellos que sobrevivieron fueron seleccionados por editores, lo cual refleja una curaduría del contenido presentado en el sitio.
Capturas Históricas
- Se registraron 872 capturas del sitio a través de herramientas como Alexa crawler. Esto muestra cómo se documentó su evolución a lo largo del tiempo.
¿Qué pasó con las capturas del sitio?
Última captura y su significado
- La última captura del sitio se realizó el 14 de diciembre de 2012, y no se tiene información sobre lo que ocurrió después.
- La curaduría de las capturas no fue realizada por una persona, sino por un crawler automatizado que decidió qué información guardar.
- Este proceso resalta la importancia de entender cómo se recopila la información en línea, ya que es una máquina la que realiza estas decisiones.
Limitaciones en la observación
- No se dispone de todas las observaciones posibles; solo hay un número limitado de capturas (872 en diez años), lo cual es insuficiente para reflejar toda la actividad del sitio.
- A pesar de ser pocas capturas, son suficientes para explorar un sitio que ya no existe y comprender su contexto histórico.
Desplazamiento hacia nuevas plataformas
- Las personas involucradas en el espacio original se dispersaron hacia nuevos proyectos, sin migrar a una nueva organización centralizada.
- El ciberactivismo evolucionó hacia plataformas como Facebook entre 2010 y 2011, donde se canalizó gran parte del activismo digital.
¿Cómo se documenta el contenido?
Fuentes y tipos de datos
- Se identifican fuentes más allá de las 872 capturas; cada captura representa un conjunto diverso de datos.
- Los tipos de datos incluyen principalmente texto HTML, representando aproximadamente el 90% del contenido almacenado.
Importancia del texto frente a otros formatos
- Aunque hay imágenes y audio presentes, el texto es el elemento central en este tipo de documentación.
- Las imágenes complementan al texto pero no son predominantes; su función es reforzar la narrativa textual.
Medios adicionales utilizados
- Además del texto e imágenes, existían formatos como audio y video. Sin embargo, muchos contenidos nunca fueron guardados a pesar de haber sido transmitidos.
- En los centros de medios independientes había radios y streaming para eventos específicos, aunque esto también limitaba la preservación completa del material audiovisual.
Explorando los datos obtenidos
Análisis adicional sobre los archivos
¿Cómo capturar y analizar información de medios digitales?
Introducción a la captura de información
- Se discute la variedad de tipos de contenido en aplicaciones multimedia, incluyendo texto, imágenes, audio y video. La importancia radica en cómo se puede explorar esta información.
- Se menciona que la información no solo es texto, sino que se fragmenta en diferentes tipos de medios, lo cual afecta su exploración y análisis.
Herramientas para la captura de datos
- El presentador utiliza Python y una librería llamada "Wayback" para realizar capturas desde Internet Archive. Esta herramienta permite recuperar datos específicos desde URLs.
- Es crucial identificar la fecha de captura al utilizar Wayback, ya que esto ayuda a contextualizar los datos recuperados.
Proceso de recuperación y análisis
- La librería permite una limpieza efectiva de la información recuperada, facilitando el acceso a todas las URLs del sitio web analizado.
- Se realiza un ejercicio preliminar donde solo se recupera el texto visible en una página específica, lo que limita el análisis a una lectura superficial.
Limitaciones del enfoque inicial
- La captura realizada es considerada superficial porque solo abarca el contenido visible sin profundizar en los hipervínculos o conexiones adicionales presentes en la página.
- Para un análisis más profundo sería necesario implementar programación adicional para explorar los niveles de profundidad de los hipervínculos.
Normalización y visualización de datos
- Después de obtener la información, se normaliza para eliminar elementos semánticamente irrelevantes antes de visualizarla con herramientas como "Boyan Tools".
- El código presentado no solo muestra cómo se lee el texto, sino también cómo este proceso implica decisiones sobre qué datos recuperar y cómo interactuar con ellos.
Ejecución del código
- Se explica que el código tiene funciones específicas que permiten leer desde una URL determinada. Esto establece un canal claro para acceder a los datos deseados.
Análisis de Capturas de Texto
Proceso de Captura y Normalización
- Se discute la captura de texto desde múltiples fuentes, enfatizando que se obtiene solo el texto sin hipervínculos ni otros elementos. Se menciona que hay más de ochocientas capturas disponibles.
- Se señala que los números son leídos como texto, lo cual implica que no se están cuantificando adecuadamente. Esto afecta la interpretación de datos numéricos.
- La información recuperada es más extensa en comparación con las primeras páginas, pero aún se limita a una sola captura por día para evitar duplicados.
- La decisión de mantener solo una captura diaria es programática; si hay múltiples capturas en un mismo día, solo se conserva una para simplificar el análisis.
- El archivo resultante se organiza cronológicamente (año-mes-día), facilitando su ordenación y visualización en una línea de tiempo.
Limpieza y Normalización del Texto
- Se realiza una normalización del texto, eliminando palabras vacías y signos de puntuación. Esto ayuda a reducir la cantidad de información procesada.
- Aunque esta limpieza reduce información valiosa, permite agrupar mejor los datos al enfocarse en términos más relevantes semánticamente.
- Los conectores dominantes son eliminados para facilitar una lectura rápida y general del contenido, aunque esto puede llevar a perder matices importantes.
- Al abrir el documento normalizado, el formato cambia a una sola línea con palabras clave significativas relacionadas con nombres u organizaciones.
- Esta reducción en la información tiene implicaciones significativas para el análisis posterior; es crucial tenerlo presente al interpretar resultados.
Visualización y Análisis
- Se explora cómo visualizar la información normalizada utilizando herramientas como Boyan Tools, que permiten un análisis preliminar rápido del contenido desestructurado.
- La herramienta genera nubes de palabras basadas en frecuencias; esto ayuda a identificar temas dominantes o relevantes dentro del corpus analizado.
- El tamaño y color de las palabras en la nube dependen únicamente de su frecuencia; no hay criterios específicos detrás del color utilizado.
- A pesar de las asociaciones intuitivas entre ciertas palabras (como "gobierno" y "Uribe"), estas no necesariamente reflejan relaciones directas dentro del contexto analizado.
Análisis de la Importancia del Procesamiento de Palabras
Dudas sobre el Procesamiento de Palabras
- Las dudas en el uso de palabras pueden ser peligrosas al leer, ya que reducen significativamente la información disponible.
- La representación visual a través de nubes de palabras puede dar una impresión errónea, mientras que un panel de términos es más representativo y permite identificar relaciones entre términos.
- Se observa una correlación entre nombres y términos relevantes, como "Uribe" y "presidente", lo que ayuda a entender su contexto en el discurso.
Identificación de Tendencias y Personajes Clave
- La identificación de nombres asociados con temas específicos, como "Jorge Enríquez" relacionado con TLC, facilita la comprensión del discurso.
- El análisis revela personajes dominantes en momentos específicos; por ejemplo, "Mauricio Torres Quiroz" fue relevante durante ciertas marchas.
Visualización y Ordenación Cronológica
- La organización cronológica y categórica permite ver qué términos son dominantes en diferentes períodos; Uribe es un personaje central desde 2002 hasta 2008.
- El TLC era un tema central en 2005, mientras que los indígenas aparecen como un canal transversal en el discurso desde 2004 hasta 2009.
Reflexiones sobre la Profundidad del Análisis
- A pesar del enfoque inicial limitado, se pueden explorar otras formas para visualizar e identificar temas y tendencias más allá del texto simple.
- Es importante buscar profundidad en las conexiones temáticas para enriquecer el análisis; actualmente se limita a datos textuales sin considerar otros formatos.
Hipertextualidad y Conexiones
- La exploración debe incluir hiperconexiones para crear una red informativa más rica que solo textualidades aisladas.
Comprendiendo la Hermenéutica y su Aplicación Práctica
La Lectura Diferente en la Hermenéutica
- La hermenéutica exige una lectura diferente que va más allá de la simple interpretación del texto, implicando un proceso técnico que incluye la percepción del código y otros elementos.
- Es fundamental entender los datos subyacentes a esta lectura para poder realizar un análisis profundo y contextualizado de cualquier proyecto o texto.
Historización de Proyectos
- A partir de la lectura de datos, se puede llevar a cabo una historización que permite comprender el impacto social de un momento específico.
- Esta historización es crucial para identificar efectos sociales que pueden ser relevantes en el análisis crítico de proyectos.