Volume 20, No. 2, Art. 22 – Mai 2019



Online-Teilnehmer*innenvideo – ein neuer Datentyp für die interpretative Sozialforschung?

Robert Schmidt & Basil Wiesse

Zusammenfassung: Online-Teilnehmer*innenvideos (OTV) werden im vorliegenden Beitrag als audiovisuelle Teilnehmer*innen-Accounts sozialer Situationen und Geschehnisse und zugleich als Bestandteile von sozialen Medien, Online-Videokultur und ihren technischen, medialen und sozialen Logiken gekennzeichnet. Dabei wollen wir zeigen, dass mit OTV ein vielschichtiger und sinnreicher Datentyp bereitsteht, der – genreabhängig – häufig ein Soziologisieren der Teilnehmer*innen dokumentiert und in der interpretativen Videoanalyse mit Gewinn genutzt werden kann. Gestützt auf die Erfahrungen aus Lehrforschungsprojekten, in denen mit diesem Datentyp v.a. im Kontext der Soziologie politischer Protestereignisse gearbeitet wurde, werden verschiedene Verfahrensschritte der Analyse von OTV vorgestellt. Dabei wird deutlich gemacht, dass die mit OTV gegebenen analytischen Möglichkeiten insbesondere im Bereich der interpretativen Soziologie des Affektiven liegen.

Keywords: interpretativ-situationale Videoanalyse; social media; Soziologie politischer Protestereignisse; Soziologie des Affektiven; Ethnomethodologie

Inhaltsverzeichnis

1. Einleitung

2. Die "Technologieabhängigkeit" interpretativer Verfahren, ihrer Datentypen und Erkenntnismöglichkeiten

3. Verfahrensschritte der Analyse von OTV und ihre Bezugsprobleme

3.1 Situiertheit und Situativität

3.2 Datenaufbereitung und Interpretation

4. "Eine Pressekonferenz endet im Desaster und mit einer Festnahme" – Auszüge aus einer Fallanalyse

4.1 Lokaltermin Pressekonferenz: Situative Verdichtungen und affektive Ladungen

4.2 Die ereignisgetriebene Dynamik des Geschehens in sieben aufeinanderfolgenden Sequenzen

4.3 Situative Solidarität, Empörung und Affizierung

4.4 OTV und die Übertragung von "Affizierungen"

5. Schluss und Ausblick

Danksagung

Anmerkungen

Literatur

Zu den Autoren

Zitation

 

1. Einleitung

In der interpretativen Soziologie finden audiovisuelle Daten, die nicht von Sozialforscher*innen selbst produziert wurden, nur selten Verwendung. Dadurch gerät der Forschung eine methodisch wie inhaltlich folgenreiche Entwicklung aus dem Blickfeld: Seit Smartphones mit Kamerafunktion zu selbstverständlichen Bestandteilen vieler alltäglicher sozialer Situationen, aber auch kultureller und politischer Ereignisse geworden sind, entsteht quasi naturwüchsig und in unüberblickbarer Menge und Vielfalt fortlaufend audiovisuelles Material, über das soziale Situationen und Geschehnisse referierbar werden. Ungeachtet dessen werden von Teilnehmer*innen hergestellte, zirkulierte und kommentierte Videos in interpretativen Verfahren der empirischen Sozialforschung nach wie vor selten berücksichtigt. Dies ist v.a. deshalb misslich, weil mit dem online zirkulierenden, von Teilnehmer*innen produzierten Videomaterial ein neuartiger, vielschichtiger und sinnreicher Datentyp bereitsteht, der – wie wir im Folgenden erläutern möchten – in der interpretativen Videoanalyse mit analytischem Gewinn genutzt werden kann. [1]

Mit dem Begriff "Online-Teilnehmer*innenvideo" (im Folgenden OTV) bezeichnen wir einen audiovisuellen Datentyp, der in Online-Videopraktiken hergestellt wird. Die nachfolgend vorgeschlagenen Verfahrensschritte der Analyse von OTV ordnen sich den nativ digitalen Methoden zu, mit denen versucht wird, die spezifischen Eigenschaften und Logiken digitaler Praktiken, Geräte und Infrastrukturen zu nutzen. Sie können von den digitalisierten Methoden abgegrenzt werden, bei denen es sich um traditionelle sozialwissenschaftliche bild-, text- oder diskursanalytische Verfahren handelt, die lediglich auf digitale Inhalte und Kontexte angewendet werden (vgl. zu dieser Unterscheidung ROGERS 2013). [2]

In der medienwissenschaftlichen Forschungsdiskussion hat sich für Online-Videopraktiken die Bezeichnung vernacular video (SNOWDON 2014) etabliert. Mit ihr wird in Abgrenzung zu professionellen Videopraktiken das "Umgangssprachliche", die lokale Spezifizität und die Alltäglichkeit dieser Praktiken betont (TUMA 2017) und unterstrichen, dass prinzipiell jede*r an ihnen teilhaben kann (BURGESS & GREEN 2009). Darüber hinaus bezieht sich das Adjektiv vernacular aber auch auf vernakuläre, d.h. historisch "gewachsene" Aktivitäten und Praktiken, mittels derer – etwa im Sinne ILLICHs (1980) – Kollektive erzeugt und aufrechterhalten werden1). Dabei kann es sich um Kollektive handeln, die sich in und durch die Online-Videopraktiken des Direktübertragens (streaming), Filmens und nachträglichen Hochladens, Verlinkens, Kommentierens etc. bilden und durch gemeinsam geteilte Aufmerksamkeiten gekennzeichnet sind (SHIFMAN 2011). Diese Kollektive müssen sich aber nicht nur – wie im Fall von "viralen Videos"2) und "Memes"3) – auf den virtuellen Raum konzentrieren, sie können auch Verbindungen mit "Offline"-Praktiken eingehen. [3]

Dies ist – wie Studien zur Rolle von OTV im Rahmen von Protest- und Widerstandsereignissen wie dem Arabischen Frühling deutlich gemacht haben (CASTELLS 2012; SCHANKWEILER 2016) – insbesondere auch in Kontexten des Politischen der Fall. Die spezifischen Eigenschaften und Qualitäten sowie einige der damit verknüpften analytischen Möglichkeiten des Datentyps OTV sind bisher v.a. in solchen Studien zum Accounting von staatlicher Gewalt und von Protestereignissen herausgestellt worden (ANDÉN-PAPADOPOULOS 2013; SNOWDON 2014, 2016; STRANGELOVE 2017; WESTMORELAND 2016). [4]

Im vorliegenden Beitrag stellen wir daran anknüpfende Überlegungen vor, die aus verschiedenen aufeinanderfolgenden Lehrforschungsprojekten und Forschungspraktika am Arbeitsbereich Prozessorientierte Soziologie der Katholischen Universität (KU) Eichstätt-Ingolstadt hervorgegangen sind. In einer angesichts der Heterogenität und Vielfalt von Online-Videopraktiken notwendigen Eingrenzung beschränken wir uns dabei auf solche Videos und Videopraktiken, die als audiovisuelle Teilnehmer*innen-Accountings von sozialen Situationen, ihrer Vollzugswirklichkeit, ihren Aufmerksamkeitszentren, affektiven Ladungen und Dynamiken verstanden werden können4). Die empirischen Materialien und Erkenntnisobjekte unserer explorativen Videoanalysen und methodologisch-methodischen Überlegungen bilden also von Situationsteilnehmer*innen fabrizierte audiovisuelle Aufzeichnungen "natürlicher", d.h. nicht für die Forschung hergestellter sozialer (politischer, kultureller etc.) Situationen5). Solche OTV fungieren als audiovisuelle Accounts von sozialen Situationen und Ereignissen; kennzeichnend hierfür ist eine situativ mehr oder weniger stark affizierte Kamera. Weil diese audiovisuellen Teilnehmer*innen-Accounts selbst affektive Agency entfalten können, kommt dem hier charakterisierten Datentyp gerade für eine interpretative empirische Soziologie des Affektiven besondere Relevanz zu (vgl. dazu auch WIESSE 2018). [5]

Um den Datentyp OTV und die mit diesem verbundenen Erkenntnismöglichkeiten eingehender zu charakterisieren, erläutern wir zunächst Zusammenhänge zwischen technologischen Entwicklungen und der Herausbildung interpretativer Strategien, Verfahren und Erkenntnismöglichkeiten (Abschnitt 2). Anschließend stellen wir die in unseren Lehrforschungsprojekten entwickelten methodologischen Überlegungen und methodischen Leitlinien zur Analyse von OTV vor (Abschnitt 3). Diese werden im darauffolgenden Abschnitt 4 an Ausschnitten aus einer Fallanalyse plausibilisiert. Beim vorgestellten Fall handelt es sich um ein im Kontext der Besetzung einer Kreuzberger Schule durch Geflüchtete, Unterstützer*innen und Aktivist*innen und ihre Belagerung durch die Polizei entstandenes Online-Teilnehmer*innenvideo. Abschließend werden die vorangegangenen Ausführungen dann nochmals zusammenfassend diskutiert (Abschnitt 5). [6]

2. Die "Technologieabhängigkeit" interpretativer Verfahren, ihrer Datentypen und Erkenntnismöglichkeiten

Veränderungen und Innovationen im Bereich der interpretativen Soziologie waren stets eng mit technologischen Entwicklungen verknüpft. So ist schon die von MALINOWSKI begründete Methode der Feldforschung nicht ohne verbesserte Verkehrswege, Transportmittel, handliche Schreibmaschinen und Ersatzfarbbänder denkbar, die in entlegene, aber erreichbar gewordene Gebiete mitgenommen werden konnten (MARKLE, WEST & RICH 2011). Für die Herausbildung neuer analytischer Perspektiven und Verfahren war im weiteren Verlauf dann insbesondere die Verfügbarkeit neuer technischer Aufzeichnungs- und Speichermedien – allen voran die Entwicklung von Tonbandgeräten und mobilen, batteriebetriebenen Kassettenrekordern zur Aufzeichnung von Gesprächen und Interviews – entscheidend (ZIEGHAUS 2009). Und schließlich hat auch die Entwicklung und Verfügbarkeit digitaler Technologien zu neuen analytischen Verfahren in der interpretativen Soziologie geführt. Beispiele hierfür sind die Entwicklung computergestützter Datengenerierungs- und Datenanalysetools oder die Erschließung neuartiger digitalkultureller Untersuchungsgegenstände (CISNEROS PUEBLA & DAVIDSON 2012; GIBBS, FRIESE & MANGABEIRA 2002). [7]

Dass die Möglichkeiten neuer technischer Medien die Entwicklung neuer Forschungsstrategien und Epistemologien begünstigen, wird z.B. an der engen Verbindung von Audiorekordern und ethnomethodologischer Konversationsanalyse (EMCA) deutlich. Mithilfe von unauffälligen und handlichen Kassettenrekordern konnten alltägliche und "natürliche", d.h. nicht für Forschungszwecke initiierte oder animierte Gespräche aufgezeichnet und registrierend konserviert werden; die Aufzeichnungstechnik konnte eingesetzt werden, um die Aufzeichnungen beliebig oft vor- und zurückzuspulen. In Verbindung mit präzisierten detaillierten Transkriptionsverfahren und einem neuen epistemologischen Interesse am tatsächlichen praktischen Prozessgeschehen einer sich fortlaufend verwirklichenden sozialen Wirklichkeit verwandelten sich die neuen Aufzeichnungs- und Speichermedien in "Zeitmaschinen" (BERGMANN 1985, S.304), mit deren Hilfe in neuartiger Weise die Temporalstruktur und Mikrologik situativer Ordnungsbildungen in kommunikativen Interaktionen analytisch aufgeschlossen werden konnte. [8]

Die Weiterentwicklung audiovisueller Aufzeichnungstechnologien in Form von immer kleineren, leichteren, kompakteren, einfacher handhabbaren und billigeren Videorekordern hat in den 1980er Jahren in ähnlicher Weise nicht nur zur Herausbildung neuer Methoden der Analyse audiovisueller Daten, sondern zugleich auch zur Erschließung neuer Untersuchungsbereiche der interpretativen Soziologie geführt (SCHNETTLER & RAAB 2008). Weil die Videotechnik es möglich machte, aufgezeichnete Bewegungsfolgen sehr fein zu zergliedern, ließ sie sich als "Interaktionsmikroskop" einsetzen, um Gestik, Mimik und andere Formen körperlichen Ausdrucksverhaltens eingehend zu studieren. Nicht zuletzt wurde dadurch schließlich auch das "goldene Zeitalter" der Soziologie der Emotionen mit eingeleitet (COLLINS 2008, S.5; vgl. auch KATZ 1999, S.10 und WETHERELL 2012, S.99f.). [9]

Videodaten finden in der interpretativen Soziologie – den genannten Forschungstraditionen folgend – bisher fast ausschließlich in Form von nach bestimmten Vorgehensweisen produziertem Material Verwendung. Sie werden von Forscher*innen hergestellt, die Interviews aufzeichnen oder im Feld Videodaten generieren. Situationale Videodaten, die nicht von Forscher*innen, sondern von Teilnehmer*innen hergestellt wurden, werden selten herangezogen. Solchen Daten gegenüber legt die interpretative Soziologie bis auf wenige Ausnahmen bisher noch eine gewisse Zurückhaltung an den Tag. Zu diesen Ausnahmen zählen partizipative Videoverfahren, wissenssoziologisch-bildhermeneutische Untersuchungen semi-professioneller Videoproduktionen (bspw. editierte Urlaubs- und Hochzeitsvideos, vgl. RAAB 2008) sowie Forschungsbeiträge aus dem Umkreis der Ethnomethodologie (BROTH 2008; GOODWIN & GOODWIN 1997; JALBERT 1999; MAIR, WATSON, ELSEY & SMITH 2012). [10]

Partizipative Video-Verfahren (PV) (MILNE, MITCHELL & LANGE 2012) kommen insbesondere im Rahmen von sogenannten Empowerment-Strategien (BERGOLD & THOMAS 2012; ROSS 2017) zum Einsatz. Bei diesem Verfahren werden ausgewählte Teilnehmer*innen von den Forscher*innen mit Videokameras ausgestattet und angeleitet, ihre Alltagserfahrungen medial zu inszenieren bzw. zu dokumentieren. Das entstehende Videomaterial wird an die Forscher*innen zurückgespielt, dialogisch interpretiert und mitunter öffentlich präsentiert (siehe bspw. PFEIFFER 2013).6) Öffentliche Online-Aktivitäten – sowohl als Methode der Ergebnispräsentation als auch als digitalethnografische Forschungsgrundlage – können hier durchaus mit einbezogen werden (TEITELBAUM 2012). PV und ähnliche Zugangsweisen zielen darauf ab, lokalen, gruppenspezifischen Sinnwelten durch den Forschungsprozess zu einem öffentlichen Ausdruck zu verhelfen. Im Unterschied dazu handelt es sich bei OTV um eigenständige und eigenlogische, d.h. nicht von Sozialforscher*innen, sondern durch soziale Situationen und ihre Geschehensdynamiken animierte und initiierte Teilnehmer*innen-Veröffentlichungen und Accountings. [11]

Bei der wissenssoziologisch-bildhermeneutischen Videoanalyse stehen die Bauformen (Schnittmuster, Bild-Ton-Arrangements etc.) der Videoproduktionen im Fokus. Es wird dabei nicht zwischen (semi-) professionellen Videos und Aufnahmen von Amateur*innen unterschieden, sondern Ziel ist, Sehordnungen, ästhetische Stilformen und schließlich Welt- und Selbstsichten von Gemeinschaften herauszuarbeiten. Diese Betonung der Konstruktionsprinzipien der Videoproduktionen geht allerdings einher mit einer Vernachlässigung der spezifisch "situationalistischen" Qualitäten von Teilnehmer*innenvideos7); Eigenschaften, die wir im Folgenden am Datentyp OTV detailliert erläutern. [12]

In ethnomethodologischen Interaktions- und Konversationsanalysen werden zwar hauptsächlich von Forscher*innen hergestellte Videodaten verwendet (vgl. u.a. HEATH 1986; LEHN 2018; MONDADA 2008). Es finden sich darüber hinaus aber auch Forschungsarbeiten, bei denen bspw. TV-Beiträge in ihren situativen und interaktiven Produktionskontexten (BROTH 2008) oder die juristischen Auswertungen eines automatisch aufgezeichneten Cockpit-Videos in einem Kampfflugzeug untersucht werden (MAIR et al. 2012). In diesen Kontexten werden Analysestrategien angewandt, die auch für die Untersuchung von OTV eine wichtige Inspirationsquelle darstellen. Dies ist gerade dort der Fall, wo der Forschungsgegenstand deutliche Parallelen zu OTV aufweist. So fokussierten Charles und Marjorie GOODWIN (1997) in ihrer Untersuchung zum Rodney-KING-Prozess die Rolle des Amateurvideos, auf welchem die Polizeiübergriffe auf den in eine Verkehrskontrolle geratenen afroamerikanischen Autofahrer Rodney KING zu sehen sind. Ihr Ziel war, die von den Anwält*innen der angeklagten Polizisten entwickelte Sehweise zu untersuchen, die diese im auf den Übergriff folgenden Gerichtsverfahren präsentieren. Die Autor*innen leuchten aus, wie genau diese Sehweise des Videos – die schließlich zum Freispruch der Angeklagten führte, der dann die nachfolgende Revolte in Los Angeles auslöste – im Gerichtssaal mithilfe eines Bündels kommunikativer und diskursiver Praktiken "durchgeführt" (accomplished) und plausibilisiert wurde. Sie zeigen, wie es den Verteidiger*innen gelang, die Geschworenen und Richter*innen in einer bestimmten Weise "sehen zu lassen" und die Videobilder nicht als brutale Gewaltanwendung der beteiligten Polizisten, sondern als sorgfältig ausgeführtes Polizeihandwerk zu erkennen. Das Video kann als ein frühes Beispiel für die neue und folgenreiche Verwendungsweise von billiger und in Alltagssituationen handhabbar gewordener Technik gelten, und die Untersuchung GOODWINs und GOODWINs stellt einen exemplarischen analytischen Umgang mit diesem neuen Gegenstand dar. Die Autor*innen interessierte insbesondere das Accounting der Videoaufnahme, d.h. die Herausbildung einer sozial organisierten Art und Weise, sie zu sehen. Demgegenüber betont Douglas MACBETH (1999) das Accounting im und durch das Aufnehmen, wie es gerade im "Bezeugen" (Witnessing) von dokumentarischem und ethnografischem Filmen aufscheine. Der Deutungspraxis in der Rezeption wird hier der Shot filmischer Praxis gegenübergestellt: ein stummer Account der Situation, der selektiv zwischen dem engagierten Folgen situativer Aufmerksamkeitszentren und dem distanzierten Dokumentieren situativer Aufmerksamkeiten changiert. Statt der von Teilnehmer*innen produzierten Seh- und Sichtweisen von Videoaufnahmen rückt hier also das audiovisuelle Teilnehmer*innen-Accounting selbst in den Mittelpunkt. [13]

Wir schließen mit unserem im Folgenden erläuterten Verfahren an die skizzierten ethnomethodologischen und situationalistischen Analyseansätze an und entwickeln sie mit Blick auf die spezifischen Anforderungen und Erkenntnismöglichkeiten des Datentyps OTV weiter. D.h. wir fragen, wie genau Teilnehmer*innen sich mittels (Smartphone-) Kameraaktivitäten filmend im situativen Geschehen orientieren, audiovisuelle Accounts dieses situativen Geschehens erzeugen, und wie diese Accounts öffentlich im Feld der Online-Videokultur und darüber hinaus platziert werden und hier ggf. "Karriere machen". [14]

Der Datentyp OTV ist dadurch charakterisiert, dass nicht Forscher*innen, sondern Teilnehmer*innen und/oder Laiensoziolog*innen (oft mehr oder weniger ungeplant und spontan) audiovisuelle Accounts von "natürlichen", d.h. nicht für die Forschung hergestellten sozialen Situationen und Ereignissen (an denen sie selbst teilhaben) produzieren und im Netz verbreiten, wo sie vielfach interpretiert, kommentiert und analysiert werden. Diese fortlaufende Proliferation von OTV ist an die spezifischen Affordanzen von internetfähigen Smartphones mit Kamerafunktion geknüpft. Zu ihren wichtigsten Gebrauchsgewährleistungen zählen ihre geringe Größe, ihr geringes Gewicht, die durch ihre Usability gewährleistete umstandslose Teilnahmefähigkeit an sozialen Situationen sowie die Möglichkeit der unmittelbaren Veröffentlichung der audiovisuellen Accounts dieser Teilnahmen und situativen Affizierungen durch (augenblickliches und umstandsloses) Hochladen in die sozialen Medien (DOVEY & ROSE 2013; JUHLIN, ENGSTRÖM & REPONEN 2010; POSTIGO 2014).8) [15]

Die aus dem kameragestützten teilnehmenden Beobachten und Berichtbarmachen von sozialen Situationen entstehenden OTV dokumentieren diese situativen Teilnehmer*innenaktivitäten des Beobachtens und Berichtens zugleich selbst mit. Von dieser grundlegenden Besonderheit ausgehend lässt sich die spezifische Qualität dieser Datensorte im Hinblick auf Kriterien wie Reaktanz und Natürlichkeit, die in der interpretativen Videoanalyse (TUMA 2017; TUMA et al. 2013) eine wichtige Rolle spielen, etwas genauer kennzeichnen. [16]

Herkömmliche Videodaten, wie sie in der interpretativen Soziologie zur Analyse von Interaktionen genutzt werden, kommen überwiegend dadurch zustande, dass Forscher*innen soziale Interaktionen mit einer Kamera "einfangen" und sich darum bemühen, durch ihre Anwesenheit ausgelöste "Verzerrungen" dieser Interaktionen zu minimieren. Diese Reaktanz der beobachteten Situationsteilnehmer*innen wird als ein dabei zu bewältigendes methodisches Problem verstanden (TUMA et al. 2013, S.13f.). Bei der Herstellung von OTV nehmen nun die Situationseilnehmer*innen selbst beobachtende, dokumentierende und interpretierende Perspektiven und Positionen ein, die denen von Sozialforscher*innen ähneln. Die Besonderheit dieses Datentyps besteht darin, dass einer auf die Anwesenheit von Forscher*innen zurückzuführenden Reaktanz keine, der situativen Reaktivität der Teilnehmer*innen und Kameraaktivitäten aber die entscheidende Bedeutung zukommt. In den Datentyp OTV selbst gehen keine (versteckten) Konstruktions- und Interpretationsleistungen der Forscher*innen ein, vielmehr sind OTV durch die praktischen Interpretationen und Konstruktionen der Teilnehmer*innen bestimmt9). OTV-Daten dokumentieren, was Teilnehmer*innen für berichtenswert halten. Sie sind ein Produkt der situativen Relevanzsetzungen der Teilnehmer*innen und der Anziehungskraft temporärer Aufmerksamkeitskerne, die sich in den sozialen Situationen bilden (COLLINS 2004). Das Kriterium, um die spezifische Qualität solcher Videodaten einzuschätzen, besteht darin zu beurteilen, wie empfindlich sie für die situativen Anforderungen, Relevanzen und Dynamiken sind. Dieses Qualitätskriterium kann mit der in der interpretativen Videoanalyse üblichen Unterscheidung zwischen künstlichen, für die Forschung produzierten und nicht für Forschungszwecke hergestellten "natürlichen" Settings und Daten (TUMA et al. 2013, S.36) nicht erfasst werden. OTV-Daten sind "natürliche" Konstruktionen der Situationen, Ereignisse und ihrer Teilnehmer*innen10). [17]

Unsere bisherigen Überlegungen zu den analytischen Möglichkeiten und Perspektiven, die von Teilnehmer*innen produzierte audiovisuelle Daten aufgrund ihrer spezifischen Eigenschaften bereithalten, lassen sich in zwei Thesen zusammenfassen:

3. Verfahrensschritte der Analyse von OTV und ihre Bezugsprobleme

Wir haben uns in unseren seit dem Sommersemester 2015 kontinuierlich durchgeführten Eichstätter Forschungsseminaren mit einem breiten Spektrum von Fällen auseinandergesetzt und nach und nach eine Reihe von Verfahrensschritten der Analyse von OTV entwickelt, von denen wir die wichtigsten hier nun im Einzelnen erläutern. Diese Verfahrensschritte beziehen sich auf verschiedene Schwierigkeiten und Bezugsprobleme, die mit den besonderen Eigenschaften des Datentyps verknüpft sind und versuchen, mit OTV gegebene Erkenntnismöglichkeiten zu realisieren. Unsere bisherigen Erfahrungen, aus denen die vorausgegangenen Charakterisierungen von OTV-Daten hervorgegangen sind, haben uns immer wieder zu der Einsicht geführt, dass diese Charakterisierungen stets auf der Fallebene relativiert und differenziert werden müssen. Sie bilden trotz ihrer Vorläufigkeit gleichwohl aber orientierende Bezugspunkte und Kriterien, die sich in unserer bisherigen Arbeit für die nähere Klassifizierung der von uns untersuchten Videos als brauchbar erwiesen haben. [19]

3.1 Situiertheit und Situativität

OTV sind zwar leicht und sprichwörtlich "auf Knopfdruck" verfügbar, sie können aber nicht einfach als sinnfällig-evidente Materialien der empirischen Forschung verwendet werden. Wo sie vertraut und selbstverständlich erscheinen, müssen sie vielmehr aktiv befremdet (GARFINKEL 1967, S.36-38), und wo sie unverständlich sind, müssen sie durch methodisches Fremdverstehen erschlossen werden. Zunächst handelt es sich bei OTV gar nicht um (durch Forschungsverfahren erzeugte) "Daten" im herkömmlichen Sinne. Beim Betrachten von Teilnehmer*innenvideos befinden wir uns als Soziolog*innen in einer ähnlichen Position wie Ethnograf*innen, die ein Geschehen beobachten, das sie erst allmählich verstehen, indem sie sich darum bemühen, es zur Sprache zu bringen, und indem sie das Feld erschließen, innerhalb dessen dem Geschehen als Fall spezifische Relevanz zukommt. [20]

Um dem Datentyp OTV gerecht zu werden, müssen die analysierten Videos zunächst als Fälle von Online-Videopraktiken untersucht werden. Damit wird dem Problem des doppelten dokumentarischen Sinns von OTV Rechnung getragen: OTV-Daten sind nicht nur Dokumente der sozialen Situation, in der sie von Teilnehmer*innen hergestellt werden, sondern zugleich auch der Online-Videopraktiken und ihrer technischen, medialen und sozialen Logiken. Dass OTV-Daten Dokumente von Online-Videopraktiken sind, zeigt sich z.B. in ihrer Betrachtbarkeit, Benutzbarkeit und in ihrer Karriere in den sozialen Medien. Erschließen lässt sich diese Karriere z.B. über die Fragen, wie genau und wo genau die Videodaten hochgeladen wurden, wie und wo sie reposted, geliked und verlinkt werden etc.14). Für die hier vorgeschlagenen Verfahrens- und Analyseschritte eignen sich alle Fälle von Online-Videopraktiken, die in ihrer doppelten Situiertheit, also sowohl hinsichtlich ihrer spezifischen Teilhabe und Teilnahme an der Online-Videokultur als auch in Bezug auf die Fragen der Situiertheit des aufgezeichneten Geschehens und des engeren situativen Entstehungskontextes der OTV-Daten bis zu einem gewissen Grad recherchierbar sind. [21]

3.1.1 Die Situiertheit des Falles in der Online-Videokultur

Online-Teilnehmer*innenvideos verweisen immer auf ihre je spezifische Online-Kontextualität. Um diese Kontextualität und die mit ihr verknüpften situativen Bedeutungsverweise, m.a.W. ihre indexikalen Sinndimensionen zu erschließen, eignen sich Verfahren, die in der soziologischen und ethnografischen Internetforschung zur Untersuchung von virtuellen Interaktions- und Kommunikationsräumen und ihren Strukturen entwickelt wurden (COLEMAN 2010; KOZINETS 2015). [22]

Die Situiertheit des untersuchten Falles kann zunächst durch Zuordnung zu bestimmten Genres (Graswurzeljournalismus, Heimvideos, Augenzeug*innenberichte, Videotagebücher, Parodien etc.) näher bestimmt werden, die sich in der Online-Videokultur mittlerweile herausgebildet haben (BLEICHER 2009, S.190ff.; SNOWDON 2014, S.413). In unserer bisherigen Arbeit hat sich zudem die Ausarbeitung der folgenden Fragen als besonders geeignet und ergiebig erwiesen, um mit der Online-Kontextualität verbundene Sinngehalte zu erschließen: Wann, in welchem zeitlichen Abstand zum gefilmten Geschehen und wo, in welchem Channel, Webportal o.ä. wurde das Video veröffentlicht? Wie genau qualifiziert es sich für die entsprechenden virtuellen Orte und Rahmungen, in denen es auftritt? In welchen unterschiedlichen Versionen und Formaten zirkuliert es? Von welchen Online-Communities wird das Video geteilt und verbreitet? Was lässt sich zu seiner Online-Karriere, zu seiner Popularität und zu seinen Reisewegen durch die sozialen Medienund möglicherweise über diese hinaus sagen? [23]

In unseren Fallanalysen sind wir immer wieder auf solche Karrieren aufmerksam geworden. Wir haben z.B. nachgezeichnet, wie ein im Kontext des Terroranschlags auf den Brüsseler Flughafen vom März 2016 entstandenes Amateurvideo ein Eigenleben als Nachrichtenmaterial entwickelt und in kürzester Zeit Verbreitung erfahren hat. Dieses Video wurde gegen Mittag u.a. auf dem YouTube-Kanal der Nachrichtenagentur AP15) mit nicht näher genannter Quelle veröffentlicht. Noch am selben Abend erschien ein Ausschnitt des Videos in der Tagesschau16). Zugleich wurde es auch von weiteren Medien aufgegriffen, bspw. in der Live-Berichterstattung der Online-Redaktionen des Guardian17) und des Stern18). [24]

Diese Blitzkarriere in der Online-Videokultur und in Offline-Medien führte zu präzisierenden analytischen Rückfragen: Wie genau qualifiziert sich dieses Video eigentlich für die skizzierte Karriere? Worin genau besteht sein durch die Online-Formate, in denen es auftaucht, gesteigerter, abgeschöpfter oder skandalisierter Aufmerksamkeitswert? Was lässt sich über das Rezipient*innen-Design des Videos sagen? Lässt sich ein je besonderer "Zeigegestus" beschreiben, der im Hochladen des Videos in die unterschiedlichen Online-Nachrichtenkanäle und durch seine Einbettung in verschiedene Formen der Berichterstattung zum Ausdruck kommen kann, u.U. aber auch durch Nachbearbeitungen (Schnitte, zusätzliche Audiospuren etc.) noch verstärkt wird? Soll das Video "einen Beweis liefern", werden forensische Zielsetzungen verfolgt, sollen bislang ignorierte Perspektiven dokumentiert werden? Inwiefern werden durch die Form der Einbettung Eigenschaften wie Authentizität, Tatsächlichkeit oder Augenzeugenschaft unterstrichen? [25]

Die Fragen, mit denen sich die Analyse von Online-Teilnehmer*innenvideos in Bezug auf die Kontextualität und Situiertheit der Fälle in der Online-Kultur befassen muss, verweisen nicht zuletzt auch auf aktuelle medienökonomische Entwicklungen: Über das Internet verfügbare Inhalte werden nämlich zunehmend nicht mehr durch die Teilnehmer*innen und User bestimmt, die Bilder, Videos u.Ä. herstellen und hochladen, sondern durch die Plattformen und Anwendungen strukturiert, die das Internet dominieren. Klickzahlen und andere Informationen, anhand derer die Karrieren bestimmter Videos nachgezeichnet werden könnten, sind häufig Gegenstand von strategischen Manipulationen19). [26]

Diese Entwicklungen drohen die eingangs skizzierten vernakulären Eigenschaften von OTV infrage zu stellen. Deshalb bemühen wir uns in unseren Analysen, material- und datenkritisch an jedem einzelnen Fall auszuweisen, inwiefern es sich um ein Teilnehmer*innenvideo handelt, und welchen spezifischen Off- und Online-Aktivitäten es seine Entstehung und Karriere verdankt. Hilfreich dafür sind Online-Recherchewerkzeuge, von denen viele in engem Zusammenhang mit kritischen Teilnehmer*innenmethoden in der Online-Videokultur selbst entwickelt wurden20). [27]

3.1.2 Die Situiertheit des aufgezeichneten Geschehens

Mittels OTV werden soziale Situationen und Geschehenszusammenhänge in einer besonderen Weise gezeigt, perspektiviert, protokolliert oder dokumentiert . Dabei sind stets die Fragen virulent, was auf welche Weise gezeigt und was verborgen wird, welche Ausschnitte eines größeren Geschehenskontextes in welcher Perspektive ins Bild gebracht werden und welche nicht. Um diese Fallspezifik des Zeigens und Ausblendens zu entschlüsseln, müssen Kontrastierungen mit anderen Berichten und Darstellungen desselben Geschehens vorgenommen werden können. Beim gefilmten Geschehen muss es sich daher um ein recherchierbares, d.h. auch in anderen medialen Formen und Diskursen beschriebenes und dargestelltes Geschehen handeln. [28]

Dies ist z.B. in Kontexten des Politischen überwiegend der Fall, denen die Mehrzahl der von uns untersuchten Fälle zugerechnet werden kann. Wir haben bisher schwerpunktmäßig mit OTV-Daten gearbeitet, die im Kontext von kontrovers debattierten, dicht diskursivierten und entsprechend gut recherchierbaren politischen Protestereignissen stehen. Dabei haben sich Following- und Mapping-Verfahren (CLARKE 2012; MARCUS 1995) sowie diskursanalytische Analysestrategien bewährt. Mithilfe solcher Verfahren kann ausgearbeitet werden, wovon genau das gefilmte Geschehen einen Ausschnitt darstellt, mit welchen weiteren Verortungen, Arenen, Schauplätzen, Infrastrukturelementen, Konzepten, Diskurspositionen etc. es verknüpft, in welche übergreifenden multilokalen und transsituativen Geschehenszusammenhänge es eingebettet ist und wie genau es im medialen Diskurszusammenhang verortet werden kann, der sich um die Geschehnisse gebildet hat. [29]

Oft führt jedoch schon die detaillierte Suche nach in den OTV-Daten selbst registrierten Hinweisen auf den Ort und die Zeit des Geschehens zu wichtigen Entdeckungen bezüglich der Situiertheit der Aufnahme. Diese Hinweise können z.B. dazu beitragen, bereits etablierte Kontextualisierungen und Deutungen zu korrigieren. Dies verdeutlicht z.B. der Fall des Videos G20: Busfahrgäste in Angst, das im Kontext der Protestaktivitäten gegen den G20-Gipfel in Hamburg im Juli 2017 entstanden ist: Wir konnten anhand der OTV-Daten, die aus der Perspektive eines Fahrgastes die Begegnung mit einem an den Busfenstern vorbeiziehenden Schwarzen Block zeigen, herausarbeiten, dass sich die gefilmten Ereignisse am ersten Tag des Gipfels um 7:30 Uhr am Morgen in der Elbchaussee, einer als "Villenviertel" bekannten Wohngegend abgespielt hatten. Die gefilmten Brandstiftungen an parkenden Autos, die von den Medien als Belege für ziellose Zerstörungen eines entfesselten und angsteinflößenden Mobs herangezogen wurden21), erhalten durch diese spezifische geografische und zeitliche Situierung eine sinnhafte Gerichtetheit (gegen eine der reichsten Wohngegenden Hamburgs und ihre Bewohner*innen) . Diese Sinndimension wurde in den weiteren Analysen dann zu den anderen disparaten Sinnschichten, die im Material entschlüsselt werden konnten, ins Verhältnis gesetzt. [30]

3.1.3 Der situative Entstehungskontext von OTV-Daten

OTV sind von Situationsteilnehmer*innen erzeugte audiovisuelle Daten, die immer auch den jeweiligen Modus der filmenden Teilnahme, die Form und den Grad der situativen Involvierung des/der Filmenden sowie das situative Agieren und Beobachten mittels der Kamera dokumentieren. Teilnahmemodus und Involvierung variieren zunächst entlang der Frage, ob das Filmen und Mitschneiden – wie im Fall von Popkonzerten und politischen Großdemonstrationen – eine typische, situationsadäquate Aktivität darstellt, oder ob es – wie etwa im Fall bestimmter liturgischer Feiern, klandestiner Aktionen o.Ä. – gegen situative soziale Regeln verstößt und versucht werden muss, sich vor zu erwartenden Sanktionierungen zu schützen. Diese situativen Spezifika manifestieren sich insbesondere in den Kameraaktivitäten und -bewegungen, die wiederum im Material Ausdruck finden. [31]

Wir haben uns in unseren Lehrforschungsprojekten insbesondere mit solchen OTV beschäftigt, die als audiovisuelle Accounts von sozialen Situationen und Ereignissen gelten können und durch eine situativ mehr oder weniger stark affizierte Kamera gekennzeichnet sind. Eine solche Empfindlichkeit der Kamera für die wechselnden Aufmerksamkeitszentren der sozialen Situation (GOFFMAN 1966, S.95-98) steht stets in einem Spannungsverhältnis zur "rekonstruierendenden Intentionalität" (CORSTEN 2018, S.802) des Filmens und Aufzeichnens. Als analytisch produktiv hat sich in diesem Zusammenhang folgende Frage erwiesen: Inwiefern werden solche Intentionalitäten (des Dokumentierens mit dem Ziel der Vergewisserung, des Zeigens, des Überwachens etc.), die die Aktivitäten des Filmens strukturieren und die mit einer je spezifischen Selektivität und Rahmung (Cadrage) verbunden sind, durch die situativen Dynamiken beeinträchtigt, zum Verschwinden gebracht, neu ausgerichtet und/oder transformiert? [32]

Darüber hinaus haben wir auch den situativen (sprachlichen und nonverbalen, körperlichen, gestischen, mimischen) Interaktionen zwischen Kamera und Situationsteilnehmer*innen bis hin zum Agieren für die Kamera besondere Aufmerksamkeit gewidmet. Auch OTV, die für die Kamera initiierte Aktivitäten zeigen, gelten in unserem methodologischen Verständnis als "natürliche" Daten, d.h. als Produkte von in der Natur des Sozialen vorzufindenden Online-Videopraktiken. Es handelt sich um einen – im Sinne des ethnografischen Naturalismus – "natürlichen", sinnreichen "ethnosoziologischen", von Teilnehmer*innen hergestellten Datentyp, der die Grundlage von Teilnehmerinterpretationen und -deutungen liefert22). Mit der Analyse von OTV bemühen wir uns nicht zuletzt auch darum, dieser ethnosoziologischen Natürlichkeit gerecht zu werden. [33]

Aus diesen Überlegungen leitet sich Fragen ab, mit denen wir in unseren gemeinsamen Interpretationssitzungen23) genauer bestimmt haben, inwieweit Kamera und soziale Situation einander ausgesetzt sind und damit ganz unterschiedliche OTV-Daten konstruiert oder erzeugt werden: Wie lassen sich die Kamerapositionen, -perspektiven und -aktivitäten charakterisieren? Handelt es sich um eine stationäre Kamera, die den Relevanzsetzungen und dynamisch wechselnden Aufmerksamkeitszentren der Situation gegenüber unsensibel ist, dafür aber eine permanente und detaillierte Registrierung des Geschehens leistet, dessen Sequenzialität registriert und entsprechend sequenzanalytisch genutzt werden kann? Oder handelt es sich um eine partizipierende Kamera, die sich in die situative Geschehenslogik involviert, vom Geschehen affiziert wird, den Relevanzsetzungen der Situation folgt, aber keine permanente Registrierung des Geschehens liefert? Können von den Teilnehmer*innen und/oder den Kameraktivitäten ratifizierte Eröffnungs- und/oder Beschließungsprozeduren situativer Abläufe erkannt werden? Wird – in ungeschnittener Sequenzialität – eine situative Dynamik gezeigt, oder finden wir bedeutungssetzende Schnitte und Montagen? [34]

3.2 Datenaufbereitung und Interpretation

Hinsichtlich der Datenaufbereitung haben wir ein daten- und fallspezifisches Vorgehen in drei Schritten entwickelt, das sich grob an den Verfahrensvorschlägen von TUMA (2017) und TUMA et al. (2013) orientiert, diese aber präzisiert, modifiziert und ergänzt, um den besonderen reflexiven Eigenschaften des Datentyps gerecht zu werden: Bei der Aufbereitung von OTV-Daten muss – wie bei jeder interpretativen Analyse von audiovisuellen Daten –zunächst das Bezugsproblem der spezifischen Komplexität dieses Datentyps bearbeitet werden. Angesichts dieser Komplexität ist eine Selektivität unumgänglich: Es muss entschieden werden, welche Aspekte der vielschichtigen Daten – auf welche Weise – in die Untersuchung einbezogen werden sollen. [35]

Dazu nehmen wir in einem ersten Schritt eine an den situativen Relevanzen orientierte Grobsequenzierung vor. D.h. wir versuchen, indem wir das Material wieder und wieder gemeinsam betrachten, Einheiten und situativ sinnhafte Sequenzen des gezeigten Geschehens zu identifizieren, die im Material selbst (durch entsprechende Interaktionen, Handlungsvollzüge, Kameraaktivitäten etc.) eröffnet, beschlossen und voneinander abgegrenzt werden. [36]

In einem weiteren Schritt wählen wir dann einzelne dieser Sequenzen für die Feinanalyse aus. Dieser Auswahlprozess ist bereits eng mit der Exploration möglicher, relevanter Fragestellungen verknüpft und orientiert sich an dem in der Grounded-Theory-Methodologie formulierten Prinzip des theoretischen Sampling (u.a. STRAUSS & CORBIN 1994). Das Ziel dieses in den Datensitzungen vorangetriebenen gemeinsamen Selektions- und Explorationsprozesses besteht darin, relevante Fragen zu entdecken und zu formulieren, auf die interessante Antworten im Material bereitliegen und gefunden werden können. [37]

Im dritten Schritt werden die ausgewählten Sequenzen gemeinsam in den Datensitzungen transkribiert. Als praktikabel hat sich dafür die Partiturschreibweise erwiesen (MORITZ 2011; TUMA et al 2013), d.h. die ausgewählten OTV-Sequenzen werden in verschiedene Modalitäten aufgeteilt, die dann systematisch abgetragen werden können. Dieser Arbeitsschritt bildet den Kern der Feinanalyse, denn es hat sich herausgestellt, dass das gemeinsame Transkribieren der ausgewählten Sequenzen oft auch analytisch sehr produktiv ist und von der Formulierung von Memos und analytischen Ideen begleitet wird, die dann auf der Grundlage des erstellten Transkriptes weiter ausgearbeitet werden können. [38]

In den Interpretations- und Datensitzungen beziehen wir uns auf OTV zunächst so, wie dies auch die Teilnehmer*innen tun. Wir mobilisieren also zunächst ein implizites, praktisches Mitgliederwissen (Membership Knowledge, vgl. HAVE 2002), das wir mit den Teilnehmer*innen der Online-Videopraktiken teilen. Die analytische Herausforderung besteht im weiteren dann darin, dieses Mitgliederwissen und -können von einer Ressource in einen expliziten Gegenstand (Topic) zu transformieren und zu fragen, wie genau die Teilnehmer*innen sich als Forscher*innen, Analytiker*innen und (Teilnehmer-) Soziolog*innen für die situativen Geschehnisse und Aktivitäten interessieren, wie genau sie diese Aktivitäten filmen, hochladen, verbreiten, wiederholt abspielen und untersuchen, befragen, kommentieren und kritisieren. Über diese Fragen nach dem wie genau erschließen sich dann auch die Problematiken und Gegenstände, um die es in den Videopraktiken geht. Wir fragen diesbezüglich also, was genau in den Videopraktiken interessiert: Was soll gezeigt, erkennbar, nachvollziehbar gemacht, perspektiviert, fokussiert, in den Mittelpunkt gerückt werden?



Abb.1: schematische Darstellung der Verfahrensschritte [39]

Im Kontext politischer Protestereignisse, in dem die Mehrzahl der Fälle angesiedelt ist, mit denen wir bisher gearbeitet haben, können wir heuristisch und vorläufig zwei unterschiedliche Grundorientierungen beschreiben, an denen das videogestützte Soziologisieren der Teilnehmer*innen ausgerichtet ist. Obwohl wir immer wieder auch Fälle gefunden haben, in denen beide Orientierungen eine wichtige Rolle spielen, lassen sie sich doch folgendermaßen gegenüberstellen: [40]

Viele Online-Videopraktiken folgen einem Gestus des Dokumentierens, Zeigens Aufdeckens, Räsonierens, Belegens, Widerlegens, Untersuchens, Beweisens und Argumentierens. Dieser Gestus wird häufig durch eine forschende Kamera und durch Genre-Formate wie Citizen Journalism oder Forensic Video besonders betont. Die entsprechenden Videopraktiken mobilisieren "ethnosoziologische" Kapazitäten und etablieren vernakuläre Gegenöffentlichkeiten. In solchen Online-Praxiszusammenhängen treten Videos häufig in kommunikative und/oder konfrontative Beziehungen zueinander: Die Polizei veröffentlicht Aufnahmen, die die von anderen Teilnehmer*innen ins Netz gestellten Accounts von Polizeigewalt widerlegen, ihre "Echtheit" bezweifeln etc. [41]

Eine zweite häufige Orientierung von Videopraktiken lässt sich als ein Gestus des Situativen und Affektiven beschreiben. Dieser Gestus wird durch eine situative – ggf. auch am Körper von Teilnehmer*innen fest montierte – Kamera und durch Formate wie den Augenzeug*innenbericht" (Eyewitness Video) besonders betont. Es interessieren insbesondere die affektiven Ladungen von Situationen; übermittelt werden soll "what it was like to be there" (SNOWDON 2014, S.415). Dabei sollen nicht nur situativ erfahrene Affizierungen bezeugt werden, sondern es geht auch darum, "mitzureißen", d.h. andere, nicht anwesende Teilnehmer*innengruppen zu affizieren (SCHANKWEILER 2016, 2017). [42]

4. "Eine Pressekonferenz endet im Desaster und mit einer Festnahme" – Auszüge aus einer Fallanalyse

Die vorangegangenen methodologischen und methodischen Überlegungen sollen nun durch Auszüge aus einer Fallanalyse weiter plausibilisiert werden. Dabei folgen wir den im vorherigen Abschnitt skizzierten Verfahrensschritten. Unser Fall steht im Kontext der Geschehnisse rund um die Besetzung der Gerhard-Hauptmann-Schule (GHS) in Berlin-Kreuzberg im Juni 2014 durch eine Gruppe von Geflüchteten und Aktivistin*innen und die neun Tage andauernde Belagerung des besetzten Gebäudes und des umliegenden Kreuzberger Wohngebietes durch die Polizei24). [43]

4.1 Lokaltermin Pressekonferenz: Situative Verdichtungen und affektive Ladungen

Das Video wurde unter dem Titel "Eine Pressekonferenz endet im Desaster und mit einer Festnahme" von Andreas KOPIETZ, einem Journalisten (Kriminalreporter) der Berliner Zeitung am 26. Juni 2014, dem Tag des gefilmten Geschehens, auf YouTube hochgeladen25). Es hat eine Länge von 2 Minuten und 24 Sekunden, befindet sich bis heute – neben anderen Videos aus dem genannten Geschehenskontext und solchen mit überwiegend berlinspezifischen Themen – auf dem von Andreas KOPIETZ unterhaltenen YouTube-Kanal und wurde über 34.500 mal aufgerufen26). In den Tagen der Besetzung der GHS und der Absperrungen des angrenzenden Wohnviertels zirkulierte eine Fülle von OTV, die einzelne Ereignisse dokumentierten und in den sozialen Medien verbreitet wurden. Viele dieser OTV sind heute nicht mehr verfügbar. Die Polizei beteiligte sich an dieser situationsspezifischen Online-Kommunikation via Twitter, sie stellte aber nicht – wie in anderen Protestkontexten mittlerweile üblich27) – eigene OTV ins Netz. Wir können – mit Bezug auf die Verfügbarkeit und auf die Zugriffszahlen – davon ausgehen, dass es sich bei unserem Fall um eines der populärsten Videos aus dem genannten Geschehenszusammenhang handelt. [44]

Den engeren situativen Kontext des im Video registrierten und fokussierten Geschehens bildete eine innerhalb der von der Polizei abgesperrten Zone vor dem besetzten Gebäude stattfindende, vom Bezirksamt Kreuzberg-Friedrichshain einberufene Pressekonferenz. Bei dieser Pressekonferenz handelte es sich um eine situative Verdichtung der damals bereits drei Tagen andauernden politischen Lage der Besetzung. Sie war durch die körperliche Kopräsenz und Nähe von antagonistisch situierten Protagonist*innen des Konfliktes gekennzeichnet und entwickelte eine besondere Dynamik. Zudem war die Pressekonferenz bereits durch ihre unmittelbare Vorgeschichte affektiv aufgeladen: Journalist*innen, die von den Besetzer*innen und Unterstützer*innen immer wieder eingeladen worden waren, war mehrere Tagen vom Bezirksamt und der Polizei der Zugang zum besetzten Gebäude und Gespräche mit den Besetzer*innen verwehrt worden. Auch am Vormittag des 26. Juni waren Pressevertreter*innen vor den Polizeiabsperrungen abgewiesen und daran gehindert worden, mit den Aktivist*innen zu sprechen28). Unter dem dadurch entstandenen öffentlichen Rechtfertigungsdruck luden Bezirkspolitiker*innen und Stadträt*innen für den Nachmittag Pressevertreter*innen ein, um ihnen vor Ort, die – aus ihrer Sicht – komplizierte Sicherheitslage zu erläutern. [45]

Das Video wurde mutmaßlich vom Journalisten Andreas KOPIETZ hergestellt (und noch am selben Tag hochgeladen), der sich zusammen mit Journalistenkolleg*innen in einem Halbkreis um den vor dem verschlossenen Tor des besetzten Gebäudes postierten Pressesprecher des Bezirksamtes befand. Für diesen situativen Entstehungskontext der Daten ist weiterhin wichtig, dass das Video nicht mit einem Smartphone, sondern wahrscheinlich mit einer professionellen Videokamera hergestellt wurde. In der Situation wurden mehrere solcher Videokameras genutzt, die zur technischen Ausstattung professioneller Journalist*innen gehören. Die OTV-Daten sind situativer Account der Pressekonferenz und ihrer rituellen Teilnehmer*innen- und Sprecher*innenrollen und damit zugleich ein Produkt der situativen und ereignisgetriebenen Dynamik, die sich im Verlauf der Pressekonferenz entfaltete. Die Konferenz wird im Folgenden entlang der Grobsequenzierung des Videos skizziert und mit Auszügen aus dem Verbaltranskript sowie Standbildern veranschaulicht. [46]

4.2 Die ereignisgetriebene Dynamik des Geschehens in sieben aufeinanderfolgenden Sequenzen

Das Video beginnt mit dem Versuch des Pressesprechers des Bezirksamtes (P), gegenüber den Journalist*innen eine Situationsdefinition zu etablieren und alle Anwesenden – grammatikalisch über die 1. Person Plural – darauf zu verpflichten:



P: "... es ist eine Situation, die von der Sicherheitslage her sehr sehr schwierig ist. Wir haben hier Menschen im Haus, die damit gedroht haben, sich vom Dach zu stürzen ..." (00:03-00:15)

Sequenz 1: Standbild 0:06 (Quelle: YouTube) [47]

Diese Eröffnungssequenz endet bereits nach wenigen Sekunden. Es beginnt eine Sequenz, in der die für das Interaktionsritual Pressekonferenz übliche Verteilung der Rederechte aufgekündigt und der Pressesprecher durch scharfe und insistierende Fragen von Journalist*innen (J1, J2 etc.) unterbrochen wird.



J2: "Ja, aber sie haben ja sicher nicht damit gedroht, sich umzubringen, wenn ne Pressekonferenz stattfinden und wir ihre Geschichte hören ..." (00:15-00:32)

Sequenz 2: Standbild 0:27 (Quelle: YouTube) [48]

Mit der daran anschließenden Sequenz nimmt das Geschehen Fahrt auf. Ein Unterstützer (U), der sich im Rücken des Pressesprechers im abgesperrten Bereich hinter dem geschlossenen Gittertor befindet, unterbricht den Pressesprecher und wendet sich an die Journalist*innen. Die Kameras und die Mikrofone wenden sich ihm zu. Es gelingt ihm, die Infrastruktur der Pressekonferenz situativ umzufunktionieren. Die Pressekonferenz des Bezirksamtes wird zur Pressekonferenz der Unterstützer*innen der Besetzung.



U: "Es besteht keinerlei Gefahr für die Pressekonferenz ..." (00:32 – 00:51)

Sequenz 3: Standbild 0:33 (Quelle: YouTube) [49]

Während der Unterstützer sich mit einer gestischen Aufforderung an die Journalist*innen, ihn zu begleiten, abwendet und durch den Hof auf das besetzte Gebäude zuläuft, versucht der Pressesprecher, das Format Pressekonferenz wieder herzustellen.



P: "Wenn sie mich immer unterbrechen, komme ich nicht dazu, ihnen vielleicht meine Beweggründe zu erklären, warum es die Situation hier erfordert, anders zu agieren, als das allgemein üblich ist. Ich fang nochmal damit an ..." (00:51-01:17)

Sequenz 4: Standbild 1:01 (Quelle: YouTube) [50]

Plötzlich zieht ein von gellenden Schreien begleitetes Ereignis im abgesperrten Hof vor dem besetzten Gebäude die Aufmerksamkeit aller Situationsteilnehmer*innen auf sich. Die Kamera wird vom Pressesprecher abgewendet und in die Richtung der Schreie geschwenkt. Sie fokussiert schließlich auf eine Gruppe von vier Polizisten, die auf dem am Boden liegenden Unterstützer knien. Er wurde auf seinem Rückweg ins besetzte Gebäude offenbar zu Boden gerissen und macht durch lautes Schreien auf dieses Widerfahrnis aufmerksam. Die Journalist*innen reagieren sehr empört durch erregte Anklagen und Rufe, die sich zunächst v.a. an den Pressesprecher richten.



J2: "Können Sie einschreiten? Verteidigen Sie die Menschenrechte! Warum machen Sie da nichts? Wie zynisch kann das sein? (...)" J3:" Ekelhaft ist das, was hier passiert! Das ist so unfassbar! Widerlich! (...)" (01:17-01:57)

Sequenz 5: Standbild 1:21 (Quelle: YouTube) [51]

Der Pressesprecher gibt seine Versuche, sich gegen die empörten Journalist*innen Gehör zu verschaffen, auf und wendet sich einer im Hintergrund stehenden Gruppe von Bezirksamtsvertreter*innen zu. Mit seiner Abwendung scheint er das Scheitern der Pressekonferenz zu besiegeln. Ein Teilnehmer aus der Gruppe der Bezirksamtsvertreter*innen (B1) erhält die Aufmerksamkeit der Kamera und verteidigt die Rolle des Bezirksamtes29).



B1: "Wir haben gesagt, die solln den in Ruhe lassen!" (01:57-02:20)

Sequenz 6: Standbild 2:02 (Quelle: YouTube) [52]

Begleitet von empörten Rufen der Journalist*innen wird die Kamera wieder dem Geschehen im Hof hinter den Gitterstäben des geschlossenen Tores zugewendet. Die vorher knienden Polizist*innen stehen wieder, der Unterstützer scheint verschwunden. Mit einer Äußerung aus den Reihen der Journalist*innen, nah am Mikrofon der Kamera, wird die Situation beendet, das Video bricht ab.



J(?): "... und das bei einer Pressekonferenz!" (02:20-02:24)

Sequenz 7: Standbild 2:21 (Quelle: YouTube) [53]

4.3 Situative Solidarität, Empörung und Affizierung

Wir haben die 5. Sequenz für eine ausführliche Feinanalyse ausgewählt, da das situative Geschehen hier eine besondere affektive Ladung erhält. Unsere Ergebnisse lassen sich folgendermaßen zusammenfassen: In dieser Sequenz wird mittels der OTV-Daten registriert und ratifiziert, wie sich situativ ein "mutual-focus / emotional entrainment mechanism" (COLLINS 2004, S.xi) aufbaut und einen Großteil der Situationsteilnehmer*innen, insbesondere aber die Journalist*innen, erfasst und mitreißt. Deren heftige Empörung verweist auf eine in den vorangegangenen Interaktionen etablierte situative Solidarität. Die Verletzung dieser zuvor hergestellten, beglaubigten und bindenden sozialen Norm wird mit moralischem Gefühlsausdruck beantwortet. Der schreiend zu Boden gerissene Unterstützer war wenige Sekunden zuvor noch ein Interaktionspartner der Journalist*innen und genoss einen in der Umfunktionierung der Pressekonferenz situativ etablierten Sprecher-, Personen- und Mitgliedschaftsstatus, der durch die Polizisten, die ihn zu Boden rissen, grob verletzt wurde. Die aufwallende Empörung ist eine konzertierte Hervorbringung der Teilnehmer*innen. Dabei spielt insbesondere die situative Modulierung (GOFFMAN 1980 [1974]) des Schreiens eine wichtige Rolle: Es handelt sich um adressierte Schreie in der situativen Kopräsenz potenziell empörungsfähiger Augen-, Ohren- und Video-Zeug*innen. Die Empörung richtet sich gegen den Pressesprecher sowie gegen die Polizisten, die die Festnahme vollstreckten, und bringt die anwesenden Vertreter*innen des Bezirksamtes in eine schwierige Lage. Einer in unseren Datensessions nicht unwidersprochen gebliebenen Interpretation zufolge sabotiert die Polizei vor den Augen und den laufenden Kameras der Journalist*innen die vom Bezirksamt einberufene Pressekonferenz und damit dessen kommunikationsstrategische Absichten30). [54]

4.4 OTV und die Übertragung von "Affizierungen"

Zusammenfassend lässt sich festhalten, dass die in den OTV-Daten fixierte situative, ereignishafte und affektive Geschehensdynamik sich bereits einer affektiven Voraufladung verdankt, die durch die Aussperrung der Presse in den vorausgegangenen Tagen der Besetzung und Polizeibelagerung zustande gekommen war. Viele Journalist*innen, die zur Pressekonferenz vor das besetzte Gebäude kamen, waren über die Informationspolitik des Bezirksamtes, das sich unter einem enormen Rechtfertigungsdruck befand, bereits sehr verärgert. Die Verhaftung des Unterstützers und der Bruch der situativen Solidarität steigerten diese affektiven Voraufladungen dann dramatisch. Die im Video festgehaltenen Ereignisse affizierten nicht nur alle Teilnehmer*innen, die sich in Hör- und Sichtweite des Geschehens befanden, sondern sollten auch die Betrachter*innen des Videos affizieren und fesseln. Im Video wurde mit der Festnahme des Unterstützers ein – von den Teilnehmer*innen als solches markiertes – plötzlich hereinbrechendes, überraschendes und situativ unwahrscheinliches Ereignis festgehalten. Es erhielt sehr viel Aufmerksamkeit, machte schon in den Tagen der andauernden Besetzung und Belagerung der GHS eine beachtliche Online-Karriere und fungierte als medialer Träger, Verstärker und Vermittler der skizzierten Affizierungen. Daran anknüpfend können wir davon ausgehen, dass OTV-Praktiken offenbar in der Lage sind, registrierte Affizierungen mit zu übertragen. Dieses affektive Broadcasting via OTV setzt allerdings eine Affizierbarkeit und ein praktisches Affektverständnis (WIESSE 2019) der Teilnehmer*innen voraus. Voraussetzungen hierfür bilden sich durch die Involvierung in off- und online operierende Praktiken, d.h., sie sind nicht an körperliche Anwesenheit und Kopräsenz gebunden. So können die gerade für politische Situationen und Protestereignisse konstitutiven Aufmerksamkeitsbindungen intensiviert werden und auch bei den Teilnehmer*innen von Online-Praktiken moralische Gefühle (z.B. Empörung) wecken und verstärken – oder bestehende moralische Bewertungsschemata aus dem Gleichgewicht bringen. Mit diesen Charakterisierungen ist die spezifische Relevanz von OTV näher bestimmt, die sich gerade im Kontext politischer Bewegungen immer wieder entwickelt und Online-Videopraktiken zu einem festen Bestandteil jüngerer politischer Protest- und Widerstandskulturen gemacht hat. [55]

5. Schluss und Ausblick

Die vorangegangenen Auszüge aus einer unserer Fallanalysen haben verdeutlicht, dass OTV dann besondere Erkenntnischancen bereithalten, wenn sie als durch eine affizierte Kamera hergestellte audiovisuelle Accounts sozialer Situationen und Ereignisse gelten und interpretiert werden können. Solche audiovisuellen Teilnehmer*innen-Accounts können auf ihren Karrierewegen durch die sozialen Medien darüber hinaus selbst affektive Wirkungen entfalten. Im Rahmen einer interpretativen empirischen Soziologie des Affektiven kommt ihnen daher eine wichtige Bedeutung zu. [56]

Wir haben Möglichkeiten und Verfahrensschritte einer Analyse "reflexiver", von Teilnehmer*innen praktizierter Formen der Videodatenproduktion und -analyse vorgeschlagen und vorgestellt. Dabei handelt es sich um einen Typus von Teilnehmer*innendaten und -verfahren, die in der interpretativen empirischen Sozialforschung bisher noch wenig beachtet werden. Diese vernakulären Produktionen können häufig – insbesondere in Kontexten des Politischen – als analysierende und soziologisierende Teilnehmer*innenpraktiken beschrieben werden (SCHEFFER & SCHMIDT 2013). Allerdings bedarf es hier weiterer Untersuchungen zur Produktion und Verwendung von OTV, um herausarbeiten, wie diese in unterschiedlichen Kontexten produziert, verbreitet und verwendet werden31). Wie genau wird eigentlich mit OTV analysiert und argumentiert? Was lässt sich über die entsprechenden Online-Videopraktiken und Ethnomethoden des Streitens, Bezweifelns, Kritisierens, Widersprechens etc. sagen? Wie genau konstituieren sich im videogestützten Soziologisieren der Teilnehmer*innen Themen, Problematiken und Gegenstände? Solche Fragen wären im Rahmen einer kritischen Social-Media-Forschung empirisch weiter auszuarbeiten. [57]

Dabei ist es entscheidend, die Arbeit mit von Teilnehmer*innen produzierten audiovisuellen Daten an den Fällen weiterzuentwickeln und dabei in einem weiteren Schritt auch die Produktions- und Gebrauchsweisen von Videodaten in der Soziologie sowie die Videopraktiken und -daten der Sozialforschung von einer Ressource in ein Topic zu transformieren und zum Gegenstand zu machen. Die interpretative Soziologie kann durch eine Entschlüsselung und Mobilisierung des entsprechenden praktischen und methodischen Mitgliederwissens von "lay or professional analysts of ordinary activities" (GARFINKEL & SACKS 1986, S.162) produktiv vorangebracht werden. Die in der Methodenliteratur dominierende Überakzentuierung einer Differenz zwischen von Teilnehmer*innen produzierten und von der Forschung hergestellten audiovisuellen Daten bzw. zwischen vernakulären Praktiken und Lai*innenanalysen auf der einen Seite und einer wissenschaftlichen Videointeraktionsanalyse auf der anderen Seite steht einer produktiven Weiterentwicklung der soziologischen Videoanalyse jedoch eher im Weg. [58]

Danksagung

Wir danken allen Teilnehmer*innen der seit dem Sommersemester 2015 an der KU Eichstätt in den Modulen "Fortgeschrittene Qualitative Methoden" und "Forschungspraktikum im Master" durchgeführten Lehrforschungsprojekte. Ebenso bedanken wir uns für die hilfreichen Hinweise und Kommentare der anonymen Gutachter*innen.

Anmerkungen

1) Im Folgenden verstehen wir Online-Teilnehmer*innenvideos also nicht in erster Linie als Medienprodukte. Eine solche in der Videografie bisher übliche Klassifizierung (TUMA, SCHNETTLER & KNOBLAUCH 2013, S.42) übersieht, dass es sich bei diesem Datentyp um Teilnehmer*innenproduktionen handelt und lässt die damit gegebenen Erkenntnismöglichkeiten ungenutzt. <zurück>

2) Als viral werden Videos verstanden, die via Online-Mundpropaganda in kürzester Zeit einen hohen Bekanntheitsgrad erlangen. <zurück>

3) Ein Meme ist im weitesten Sinne ein Internet-Witz, der durch ständige Modifikationen durch die Community relative Langlebigkeit erhalten kann. <zurück>

4) Mit dieser Eingrenzung auf Fälle, in denen das Accounting sozialer Situationen und die situative und kommunikative körperlich-gestische Aktivität des Aufzeichnens im Zentrum stehen, treten andere Genres und Fälle von Online-Teilnehmer*innenvideo wie Videotagebücher (TOLSON 2010), Facecams in Gamer-Streams und Let's Plays (ACKERMANN 2016; SMITH, OBRIST & WRIGHT 2013), Drohnenflüge (GARRETT & McCOSKER 2017) oder GoPro-Videos (ORTIZ & MOYA 2015) in den Hintergrund. Die Analyse von Datentypen, die aus solchen Online-Videopraktiken hervorgehen, bedarf einer eigenen methodologischen und methodischen Reflexion. <zurück>

5) Bei OTV-Daten handelt es sich also um eigenproduzierte oder prozessproduzierte, nicht aber um forschungsproduzierte Daten (vgl. zu dieser Unterscheidung DIETRICH & MEY 2018). <zurück>

6) PV kann damit als videobasierte Form von Photovoice, der angeleiteten Teilnehmer*innenproduktion fotografischer Essays, verstanden werden. Siehe zu Photovoice u.a. MARK und BOULTON (2017), WANG und BURRIS (1997) sowie WOODGATE, ZURBA und TENNENT (2017). <zurück>

7) Auch semiprofessionell hergestellte Videos könnten als Arrangements von für die Teilnehmer*innenkamera hergestellten sozialen Situationen untersucht werden. RAAB thematisiert in seinen Analysen Situativität jedoch lediglich als bildhafte Inszenierung situationaler Authentizität (2008, S. 300ff.). Diese Vernachlässigung des Situativen zugunsten des Bildhaften ergibt sich aus den theoretischen Voreinstellungen der bildhermeneutischen Wissenssoziologie. <zurück>

8) Nach unserer Erfahrung kommen gerade bei der zeitnahen Veröffentlichung von Videos, insbesondere im Fall politischer Ereignisse, die diversen Social Media-Plattformen jeweils unterschiedlich zum Einsatz: Live-Streaming und unmittelbares Hochladen ex post verläuft tendenziell häufiger über Microblogs wie Twitter und Instagram, während Portale wie YouTube und LiveLeak eher die Funktion einer später erfolgenden Archivierung erfüllen. <zurück>

9) Diese zeigen sich z.B. in der Perspektive, den Kamerabewegungen und -handlungen, Fokussierungen, ggfs. auch in Schnitten und Montagen. <zurück>

10) In Online-Videopraktiken kommen auch häufig für die Teilnehmer*innenkamera hergestellte Situationen vor. Die skizzierte "Natürlichkeit" der Videodaten wird durch solche "Herstellungen" und Inszenierungen nicht verändert oder eingeschränkt. <zurück>

11) Wir akzentuieren damit also die situationalistischen Qualitäten von OTV. Im Unterschied dazu erkennen TUMA et al. besondere subjektive Qualitäten von Teilnehmer*innenvideos. Sie werden als "durch die Handelnden selbst selegierte Einblicke in ihre Praxis (...), in die in ganz besonderer Weise deren Selbstdeutungen eingehen", charakterisiert (2013, S.41). <zurück>

12) Wir verstehen Übertragung hier im Sinne des englischen Broadcasting und nicht als massenpsychologische Ansteckung (contagion). Vgl. zu den affekttheoretischen Problemen von Ansteckungsmetaphern WETHERELL 2012, insbes. S.145-148. <zurück>

13) Obwohl die Entschlüsselung dieses affizierenden Potenzials noch in ihren Anfängen steht, kann sich unsere These der affektiven Agency von OTV auf medienwissenschaftlich ausgerichtete Untersuchungen stützen, in denen die affizierenden und mobilisierenden Wirkungen von vernacular videos z.B. im Kontext von Protest und Gewalt (GREGORY & LOSH 2012; SCHANKWEILER 2017) oder in Bezug auf Rekrutierungsvideos des islamistischen Terrorismus (KRAIDY 2017; LEANDER 2016; STRAUB 2016) eindrücklich beschrieben wurden. <zurück>

14) Mit diesem Bezug auf die Online-Videopraktiken werden zudem all jene partizipativen Aspekte besonders betont, durch die sich die Online-Videokultur von anderen, aber verwandten kulturellen Genres wie dem Fernsehen oder dem Kino unterscheidet. <zurück>

15) https://www.youtube.com/watch?v=uwtNdk6Dxw4 [Zugriff: 26. April 2019]. <zurück>

16) https://www.tagesschau.de/multimedia/sendung/ts-13189.html (01:23-01:27) [Zugriff: 26. April 2019]. <zurück>

17) https://www.theguardian.com/world/video/2016/mar/22/brussels-airport-immediately-after-the-suicide-bomb-attack-video [Zugriff: 26. April 2019]. <zurück>

18) https://www.stern.de/politik/ausland/anschlaege-in-bruessel--amateuraufnahmen-zeigen-das-ausmass-des-terrors-am-flughafen-6760004.html (00:32-00:58) [Zugriff: 26. April 2019]. <zurück>

19) Vgl. zu diesen Entwicklungen FERRARA, VAROL, DAVIS, MENCZER und FLAMMINI (2016) sowie die Beiträge auf Portalen wie netzpolitik.org oder die Blogs und Beiträge der kritischen Datenjournalisten Richard GUTJAHR und Michael KREIL. <zurück>

20) Vgl. dazu die auf http://www.journalisten-tools.de sowie im sog. Verification Handbook erläuterten Recherchewerkzeuge. In unseren Lehrforschungsprojekten haben sich insbesondere Reverse Image Searches für die Untersuchung von Online-Kontextualität als nützlich erwiesen: Hierbei können mit Tools wie TinEye, ImgOps oder dem YouTube DataViewer von Amnesty International via (Video-Stand-) Bildern, insbes. den Vorschaubildern (Thumbnails) der Videoplattformen (und nicht mehr nur mit Schlüsselwörtern oder URLs) nach Quellen und Kontextinformationen gesucht werden. Dieses Verfahren kann in engem Zusammenhang mit den verbreiteten kritischen Teilnehmer*innenmethoden innerhalb der Online-Kultur gesehen werden, den Status von Bildern und Videos als "the document of" (GARFINKEL 1967, S.78) zu behaupten bzw. zu widerlegen. <zurück>

21) Das genannte Video tauchte, oft nur in Ausschnitten oder in stark bearbeiteter Form, in vielen Medienberichten zu den Ereignissen während des G-20 Gipfels in Hamburg auf, so z.B. in einem Bericht des ARD-Magazins Panorama, in dem es zusätzlich mit düsterer Musik und Kommentaren des Busfahrers unterlegt wurde; siehe https://daserste.ndr.de/panorama/archiv/2017/G20-Gewalt-Wer-sind-die-Taeter,gzwanzig246.html (ca. 00:50-02:06) [Zugriff: 26. April 2019]. <zurück>

22) Ethnografischer Naturalismus heißt hier, dass Ethnograf*innen "qua Methode an[nehmen], dass 'ihre Felder' [in unserem Fall das Feld der Online-Videopraktiken, RS/BW] selbstorganisierende soziale Einheiten sind, die auch dann existieren und eine innere Ordnung aufweisen, wenn sie [d.h. die Ethnograf*innen] selbst nicht zugegen sind" (BREIDENSTEIN, HIRSCHAUER, KALTHOFF & NIESWAND 2013, S.10). Solche "natürlichen Felder" werden also in der Natur des Sozialen vorgefunden. <zurück>

23) Wir haben die – nach den unten beschriebenen Verfahren aufbereiteten – Videodaten in unseren Datensitzungen stets im Interpretationskollektiv gemeinsam (grob-) sequenziert und den – ebenfalls unten beschriebenen – Prozeduren der Feinanalyse unterzogen. Dabei kam es darauf an, das implizite (Sozialitäts-) Wissen aller Teilnehmer*innen der Datensitzungen methodisch kontrolliert zu nutzen. <zurück>

24) Den weiteren politischen Kontext des Geschehens bilden die verschiedenen gemeinsamen Protestaktionen und Forderungen, mit denen das sogenannte Refugee Movement seit 2012, also lange vor dem sogenannten Flüchtlingssommer 2015, auf die schwierigen Lebensbedingungen von Flüchtlingen und Asylbewerber*innen aufmerksam gemacht hat (vgl. dazu GLÖDE & BÖHLO 2015). <zurück>

25) https://www.youtube.com/watch?v=IaSSmQI6IgU [Zugriff: 11. Oktober 2018]. <zurück>

26) Stand 11. Oktober 2018. Andreas KOPIETZ postet auf seinem YouTube-Kanal Videos mit Titeln wie "Polizeirazzia gegen Moschee in Berlin Tempelhof", "Der Tunnel, den die Bankräuber gruben" oder "Proteste gegen Naziaufmarsch". Diese Beispiele markieren einen kontextuellen Hintergrund unseres Falles. <zurück>

27) Vgl. beispielsweise die polizeiliche Verwendung von Aufnahmen zum G20-Gipfels 2017 in Hamburg sowohl zu Fahndungs- als auch PR-Zwecken (https://www.polizei.hamburg/g20-fahndungen/ bzw. https://www.youtube.com/watch?v=82lAbUM-_eI [Zugriff: 26. April 2019]). Zur Relevanz von OTV-Praktiken für die Exekutive allgemein vgl. auch die im September 2018 geführte Debatte um die "Echtheit" des sog. "Hetzjagd"-Videos von Chemnitz, die schlussendlich zur Versetzung des damaligen Verfassungsschutz-Präsidenten Hans-Georg Maaßen geführt hat (https://www.tagesschau.de/inland/maassen-reaktionen-103.html [Zugriff: 26. April 2019]). <zurück>

28) Dies sei geschehen, um "Maßnahmen nicht zu erschweren", erklärte der Sprecher des Bezirksamtes (https://www.freitag.de/autoren/dame-von-welt/raeumung-der-gerhart-hauptmann-schule [Zugriff: 1. May 2019]). <zurück>

29) Die Oppositionsbeziehung in diesem Satz ist für die weitere Analyse aufschlussreich: Die Gegenüberstellung von Bezirksamt ("wir") und Polizei ("die") deutet an, dass die Berliner Polizei in der politischen Lage rund um die Besetzung der GHS im Juni 2014 zunehmend als eigenständige politische Akteurin und als Gegenspielerin des von der Partei Die Grünen geführten Bezirksamtes agierte. <zurück>

30) Davon abweichend wurde in der Interpretationsgruppe darauf hingewiesen, dass anhand der OTV-Daten und der nachträglich nur eingeschränkt möglichen Kontextrecherchen nicht geklärt werden könne, wie und warum der Unterstützer – unter den Augen der im Hof präsenten Polizisten – zunächst vom besetzten Gebäude aus zum Schultor gelangen konnte. Ließ ihn die Polizei auf Geheiß des Bezirksamtes zunächst gewähren oder konnte er unbemerkt zur Pressekonferenz am Schultor vordringen? <zurück>

31) Vgl. dazu für die Kontexte Polizeiarbeit, Fußball und Marktforschung TUMA (2017). Für die Analyse der verschiedenen Gebrauchsweisen und Online-Aktivitäten im Zusammenhang mit OTV wären (digitalethnografische) Studien entscheidend, die weitere empirische Differenzierungen voranbringen. Im Zuge einer solchen Differenzierung der hier entwickelten These einer affektiven Potenzialität von OTV wäre beispielsweise davon auszugehen, dass eine praktische Grundkompetenz in OTV-spezifischem "learning to be affected" (LATOUR 2004, S.209) zwar eine Grundbedingung der Teilhabe an OTV-Praktiken darstellt. Diese ist jedoch von etwaigen "affektiven Inhalten" bspw. im Sinne moralischer Gefühle zu unterscheiden, die Betrachter*innen zwar durch ein Video direkt oder durch dessen kontextuelle Einbettung nahegelegt, in der Praxis aber durchaus dissonant beantwortet werden können (vgl. SMITH & McDONALD 2011, S.306f.). <zurück>

Literatur

Ackermann, Judith (Hrsg.) (2016). Phänomen Let's Play-Video: Entstehung, Ästhetik, Aneignung und Faszination aufgezeichneten Computerspielhandelns. Wiesbaden: Springer VS.

Andén-Papadopoulos, Kari (2013). Citizen camera-witnessing: Embodied political dissent in the age of "mediated mass self-communication". New Media & Society, 16(5), 753-769.

Bergmann, Jörg (1985). Flüchtigkeit und methodische Fixierung sozialer Wirklichkeit. Aufzeichnungen als Daten der interpretativen Soziologie. In Wolfgang Bonß & Heinz Hartmann (Hrsg.), Entzauberte Wissenschaft: Zur Relativität und Geltung soziologischer Forschung (Sonderband 3 der Zeitschrift "Soziale Welt") (S.299-320). Göttingen: Schwarz.

Bergold, Jarg & Thomas, Stefan (2012). Partizipative Forschungsmethoden: Ein methodischer Ansatz in Bewegung. Forum Qualitative Sozialforschung / Forum: Qualitative Social Research, 13(1), Art. 30, http://dx.doi.org/10.17169/fqs-13.1.1801 [Zugriff: 23. April 2019].

Bleicher, Joan Kristin (2009). Zirkulationen medialer Bilderwelten. Wechselwirkungen zwischen Fernsehen und YouTube. In Hannah Birr, Maike Sarah Reinerth & Jan-Noël (Hrsg.), Probleme filmischen Erzählens (S.177-200). Berlin: Lit.

Breidenstein, Georg; Hirschauer, Stefan; Kalthoff, Herbert & Nieswand, Boris (2013). Ethnografie. Die Praxis der Feldforschung. Konstanz: UVK

Broth, Mathias (2008). The studio interaction as a contextual resource for TV-production. Journal of Pragmatics, 40(5), 904-926.

Burgess, Jean & Green, Joshua (2009). YouTube. Online video and participatory culture. Cambridge: Polity.

Castells, Manuel (‭2012). ‭Networks of outrage and hope – social movements in the‬‬ internet age. ‭Chichester: Wiley‬‬‬‬‬‬‬‬‬‬‬‬‬‬‬‬‬‬‬‬‬‬‬‬‬‬‬‬‬‬‬‬‬‬‬‬‬‬‬‬‬‬‬‬‬‬‬‬‬‬‬‬‬‬‬‬‬‬‬‬‬‬‬‬‬‬‬‬‬‬‬‬‬‬‬‬‬‬‬‬‬‬‬‬‬‬‬‬‬‬‬‬‬‬‬‬‬‬‬‬‬‬‬‬‬‬‬‬‬‬‬‬‬‬‬‬‬‬‬‬‬‬‬‬‬‬‬‬‬‬‬‬‬‬‬‬‬‬‬‬‬‬‬‬‬‬‬‬.‬‬‬‬‬‬‬‬‬‬‬‬‬‬‬‬‬‬‬‬‬‬‬‬‬‬‬‬‬‬‬‬‬‬‬‬‬‬‬‬‬‬‬‬‬‬‬‬‬‬‬‬‬‬‬‬‬

Cisneros Puebla, César A. & Davidson, Judith (2012). Qualitative computing and qualitative research: Addressing the challenges of technology and globalization. Forum Qualitative Sozialforschung / Forum: Qualitative Social Research, 13(2), Art. 28, http://dx.doi.org/10.17169/fqs-13.2.1853 [Zugriff: 23. April 2019].

Clarke, Adele (2012). Situationsanalyse. Grounded Theory nach dem Postmodern Turn. Wiesbaden: Springer VS.

Coleman, E. Gabriella (2010). Ethnographic approaches to digital media. Annual Review of Anthropology, 39, 487-505.

Collins, Randall (2004). Interaction ritual chains. Princeton, NJ: Princeton University Press.

Collins, Randall (2008). Violence. A micro-sociological theory. Princeton, NJ: Princeton University Press.

Corsten, Michael (2018). Videoanalyse – Quo vadis?. In Christine Moritz & Michael Corsten (Hrsg.), Handbuch Qualitative Videoanalyse (S.799-817). Wiesbaden: Springer VS.

Dietrich, Marc & Mey, Günter (2018). Grounding visuals. Annotationen zur Analyse audiovisueller Daten mit der Grounded-Theory-Methodologie. In Christine Moritz & Michael Corsten (Hrsg.), Handbuch Qualitative Videoanalyse (S.135-152). Wiesbaden: Springer VS.

Dovey, Jon & Rose, Mandy (2013). "This great mapping of ourselves". New documentary forms online. In Brian Winston (Hrsg.), The documentary film book (S.366-375). London: Palgrave Macmillan.

Ferrara, Emilio; Varol, Onur; Davis, Clayton; Menczer, Filippo & Flammini, Alessandro (2016). The rise of social bots. Communications of the ACM, 59(7), 96-104.

Garfinkel, Harold (1967). Studies in ethnomethodology. Englewood Cliffs, NJ: Prentice-Hall.

Garfinkel, Harold & Sacks, Harvey (1986). On formal structures of practical actions. In Harold Garfinkel (Hrsg.), Ethnomethodological studies of work (S.157-189). London: Routledge & Kegan Paul.

Garrett, Bradley L. & McCosker, Anthony (2017). Non-human sensing: New methodologies for the drone assemblage. In Edgar Gómez Cruz, Shanti Sumartojo & Sarah Pink (Hrsg.), Refiguring techniques in digital visual research (S.13-23). Cham: Palgrave Macmillan.

Gibbs, Graham R.; Friese, Susanne & Mangabeira, Wilma C. (2002). Technikeinsatz im qualitativen Forschungsprozess. Einführung zu FQS Band 3(2). Forum Qualitative Sozialforschung / Forum: Qualitative Social Research, 3(2), Art. 8, http://dx.doi.org/10.17169/fqs-3.2.847 [Zugriff: 23. April 2019].

Glöde, Harald & Böhlo, Berenice (2015). Der Marsch der protestierenden Flüchtlinge von Würzburg nach Berlin und ihr Protest bis heute. Forschungsjournal Soziale Bewegungen, 28(4), 75-85.

Goffman, Erving (1966). Behavior in public places. New York, NY: Free Press.

Goffman, Erving (1980 [1974]). Rahmen-Analyse. Ein Versuch über die Organisation von Alltagserfahrungen. Frankfurt/M.: Suhrkamp.

Goodwin, Charles & Goodwin, Marjorie H. (1997). Contested vision: The discursive constitution of Rodney King. In Britt-Louise Gunnarsson, Per Linell & Bengt Nordberg (Hrsg.), The construction of professional discourse (S.292-316). New York, NY: Longman.

Gregory, Sam & Losh, Elizabeth (2012). Remixing human rights: Rethinking civic expression, representation and personal security in online video. First Monday, 17(8), Art. 1, https://doi.org/10.5210/fm.v17i8.4104 [Zugriff: 26. April 2019].

Have, Paul ten (2002). The notion of member is the heart of the matter: On the role of membership knowledge in ethnomethodological inquiry. Forum Qualitative Sozialforschung / Forum: Qualitative Social Research, 3(3), Art. 21, http://dx.doi.org/10.17169/fqs-3.3.834 [Zugriff: 23. April 2019].

Heath, Christian (1986). Body movement and speech in medical interaction. Cambridge: Cambridge University Press.

Illich, Ivan (1980). Schattenarbeit oder vernakuläre Tätigkeiten. Zur Kolonisierung des informellen Sektors. Technologie und Politik. Das Magazin zur Wachstumskrise, 15, 48-63.

Jalbert, Paul L. (Hrsg.) (1999). Media studies: Ethnomethodological approaches. Lanham, MD: University Press of America.

Juhlin, Oskar; Engström, Arvid & Reponen, Erika (2010). Mobile broadcasting – the whats and hows of live video as a social medium. In Marco de Sá, Luís Carriço & Nuno Correia (Hrsg.), MobileHCI '10 proceedings of the 12th International Conference on Human Computer Interaction With Mobile Devices and Services (S.35-44). New York, NY: ACM.

Katz, Jack (1999). How emotions work. Chicago, IL: University of Chicago Press.

Kozinets, Robert V. (2015). Netnography: Redefined. Los Angeles, CA: Sage.

Kraidy, Marwan M. (2017). The projectilic image: Islamic state's digital visual warfare and global networked affect. Media, Culture & Society, 39(8), 1194-1209.

Latour, Bruno (2004). How to talk about the body? The normative dimension of science studies. Body & Society, 10(2-3), 205-229.

Leander, Anna (2016). Digital/commercial (in)visibility: The politics of DAESH recruitment videos. European Journal of Social Theory, 20(3), 348-372.

Lehn, Dirk vom (2018). Ethnomethodologische Interaktionsanalyse. Videodaten analysieren und die Organisation von Handlungen darstellen. Weinheim: Beltz Juventa.

Macbeth, Douglas (1999). Glances, trances, and their relevance for a visual sociology. In Paul L. Jalbert (Hrsg.), Media studies: Ethnomethodological approaches (S.135-170). Lanham, MD: University Press of America.

Mair, Michael; Watson, Patrick G.; Elsey, Chris & Smith, Paul V. (2012). War-making and sense-making: Some technical reflections on an instance of "friendly fire". The British Journal of Sociology, 63(1), 75-96.

Marcus, George E. (1995). Ethnography in/of the world system: The emergence of multisited ethnography. Annual Review of Anthropology, 24, 95-117.

Mark, Glenis & Boulton, Amohia (2017). Indigenising photovoice: Putting Māori cultural values into a research method. Forum Qualitative Sozialforschung / Forum: Qualitative Social Research, 18(3), Art. 19, http://dx.doi.org/10.17169/fqs-18.3.2827 [Zugriff: 23. April 2019].

Markle, D. Thomas; West, Richard E. & Rich, Peter J. (2011). Beyond transcription: Technology, change, and refinement of method. Forum Qualitative Sozialforschung / Forum: Qualitative Social Research, 12(3), Art. 21, http://dx.doi.org/10.17169/fqs-12.3.1564 [Zugriff: 23. April 2019]

Milne, Elisabeth-Jane; Mitchell, Claudia & Lange, Naydene de (Hrsg.) (2012). Handbook of participatory video. Lanham, MD: AltaMira.

Mondada, Lorenza (2008). Using video for a sequential and multimodal analysis of social interaction: Videotaping institutional telephone calls. Forum Qualitative Sozialforschung / Forum: Qualitative Social Research, 9(3), Art. 39, http://dx.doi.org/10.17169/fqs-9.3.1161 [Zugriff: 23. April 2019].

Moritz, Christine (2011). Die Feldpartitur. Multikodale Transkription von Videodaten in der Qualitativen Sozialforschung. Wiesbaden: VS Verlag für Sozialwissenschaften.

Ortiz, María J. & Moya, José A. (2015). The action cam phenomenon: A new trend in audiovisual production. Communication & Society, 28(3), 51-64.

Pfeiffer, Constanze (2013). Giving adolescents a voice? Using videos to represent reproductive health realities of adolescents in Tanzania. Forum Qualitative Sozialforschung / Forum: Qualitative Social Research, 14(3), Art. 18, http://dx.doi.org/10.17169/fqs-14.3.1999 [Zugriff: 23. April 2019].

Postigo, Hector (2014). The socio-technical architecture of digital labor: Converting play into YouTube money. New Media & Society, 18(2), 332-349.

Raab, Jürgen (2008). Visuelle Wissenssoziologie. Theoretische Konzeption und materiale Analysen. Konstanz: UVK.

Rogers, Richard (2013). Digital methods. Cambridge, MA: MIT-Press.

Ross, Karen (2017). Making empowering choices: How methodology matters for empowering research participants. Forum Qualitative Sozialforschung / Forum: Qualitative Social Research, 18(3), Art. 12, http://dx.doi.org/10.17169/fqs-18.3.2791 [Zugriff: 23. April 2019].

Schankweiler, Kerstin (2016). Affektive Dynamiken von Bildern in Zeiten von Social Media. Bildzeugenschaften aus Ägypten, 2010-2013. Kritische Berichte. Zeitschrift für Kunst- und Kulturwissenschaften, 44(1), 72-85.

Schankweiler, Kerstin (2017). Reverse Big Brother. Videos von Polizeigewalt in den sozialen Medien. kolik.film, 27, 67-72.

Scheffer, Thomas & Schmidt, Robert (2013). Public Sociology: eine praxeologische Reformulierung. Soziologie, 42(3), 255-270.

Schnettler, Bernt & Raab, Jürgen (2008). Interpretative visual analysis. Developments, state of the art and pending problems. Forum Qualitative Sozialforschung / Forum: Qualitative Social Research, 9(3), Art. 31, http://dx.doi.org/10.17169/fqs-9.3.1149 [Zugriff: 23. April 2019].

Shifman, Limor (2011). An anatomy of a YouTube meme. New Media & Society, 14(2), 187-203.

Smith, Christina M. & McDonald, Kelly M. (2011). The mundane to the memorial: Circulating and deliberating the war in Iraq through vernacular soldier-produced videos. Critical Studies in Media Communication, 28(4), 292-313.

Smith, Thomas P.B.; Obrist, Marianna & Wright, Peter (2013). Live-streaming changes the (video) game. In Paolo Paolini, Paolo Cremonesi & George Lekakos (Hrsg.), EuroITV '13 proceedings of the 11th European Conference on Interactive TV and Video (S.131-138). New York, NY: ACM.

Snowdon, Peter (2014). The revolution will be uploaded: Vernacular video and the Arab spring. Culture Unbound, 6, 401-429, http://dx.doi.org/10.3384/cu.2000.1525.146401 [Zugriff: 26. April 2019].

Snowdon, Peter (2016). "Film!" – the Arab revolutions and the filmmaker as amanuensis. Visual Anthropology, 29, 263-277.

Strangelove, Michael (2017). The value system. The Internet and radical change in a time of crisis. Ottawa: Selbstverlag.

Straub, Verena (2016). Suicide bomber's video testimonies. Nomoi, 30. Dezember, http://nomoi.hypotheses.org/344 [Zugriff: 26. April 2019].

Strauss, Anselm & Corbin, Juliet (1994). Grounded theory methodology: An overview. In Norman K. Denzin (Hrsg.), Handbook of qualitative research (S.273-285). London: Sage.

Teitelbaum, Pamela (2012). Online participatory communication. Re-seeing participatory video practices and research. In Elisabeth-Jane Milne, Claudia Mitchell & Naydene de Lange (Hrsg.), Handbook of participatory video (S.412-425). Lanham, MD: AltaMira.

Tolson, Andrew (2010). A new authenticity? Communicative practices on YouTube. Critical Discourse Studies, 7(4), 277-289.

Tuma, René (2017). Videoprofis im Alltag. Die kommunikative Vielfalt der Videoanalyse. Wiesbaden. Springer VS.

Tuma, René; Schnettler, Bernt & Knoblauch, Hubert (2013). Videographie. Einführung in die interpretative Videoanalyse sozialer Situationen. Wiesbaden: Springer VS.

Wang, Caroline & Burris, Mary Ann (1997): Photovoice: Concept, methodology, and use for participatory needs assessment. Health Education & Behavior, 24(3), 369-387.

Westmoreland, Mark R. (2016). Street scenes. The politics of revolutionary video in Egypt. Visual Anthropology, 29, 243-262.

Wetherell, Margaret (2012). Affect and emotion. A new social science understanding. London: Sage.

Wiesse, Basil (2018). Situationen und ihre Smartphones. Affektivität in Situationsvideo. In Larissa Pfaller & Basil Wiesse (Hrsg.), Stimmungen und Atmosphären. Zur Affektivität des Sozialen (S.263-285). Wiesbaden: Springer VS.

Wiesse, Basil (2019). Affective practice. In Jan Slaby & Christian von Scheve (Hrsg.), Affective societies. Key concepts (S.131-139). London: Routledge.

Woodgate, Roberta L.; Zurba, Melanie & Tennent, Pauline (2017). Worth a thousand words? Advantages, challenges and opportunities in working with photovoice as a qualitative research method with youth and their families. Forum Qualitative Sozialforschung / Forum: Qualitative Social Research, 18(1), Art. 2, http://dx.doi.org/10.17169/fqs-18.1.2659 [Zugriff: 23. April 2019].

Zieghaus, Sebastian (2009). Die Abhängigkeit der Sozialwissenschaften von ihren Medien. Grundlagen einer kommunikativen Sozialforschung. Bielefeld: Transcript.

Zu den Autoren

Robert SCHMIDT ist Professor für prozessorientierte Soziologie am Fachbereich Soziologie der KU Eichstätt-Ingolstadt.

Kontakt:

Prof. Dr. Robert Schmidt

KU Eichstätt-Ingolstadt
Soziologie III
Kapuzinergasse 2
85072 Eichstätt

E-Mail: RSchmidt@ku.de
URL: https://www.ku.de/ggf/soziologie/soziologie3/ueberblick/

 

Basil WIESSE ist wissenschaftlicher Mitarbeiter an der Professur für prozessorientierte Soziologie am Fachbereich Soziologie der KU Eichstätt-Ingolstadt.

Kontakt:

Basil Wiesse

KU Eichstätt-Ingolstadt
Soziologie III
Kapuzinergasse 2
85072 Eichstätt

E-Mail: basil.wiesse@ku.de
URL: https://www.ku.de/ggf/soziologie/soziologie3/ueberblick/

Zitation

Schmidt, Robert & Wiesse, Basil (2019). Online-Teilnehmer*innenvideo – ein neuer Datentyp für die interpretative Sozialforschung? [58 Absätze]. Forum Qualitative Sozialforschung / Forum: Qualitative Social Research, 20(2), Art. 22, http://dx.doi.org/10.17169/fqs-20.2.3187.

Revised: July 2019

Forum Qualitative Sozialforschung / Forum: Qualitative Social Research (FQS)

ISSN 1438-5627

Creative Common License

Creative Commons Attribution 4.0 International License