Tokyo, Japan
Artist Statement *English follows
私は、ポストフォトグラフィーと技術哲学の交差点に立ち、AIと写真メディアに埋め込まれた制度や、人間性への影響を再考する作家である。
大学では心理学を専攻し、英国と南アフリカ共和国で国際NGOの感染症予防計画に従事した後、金融機関で金融およびITの実務に携わった。これは一見脈絡のない遍歴に見えるかもしれないが、この展開は学部時代の研究主題である「一般システム理論」を基盤に持つ不可視の構造への関心に根差し、また同時代の社会的イシューに対するコミットメントだった。
その後、2015年に報道写真家として写真表現をはじめ、被災地などの現場取材や、ロボットやドールなど人工物と関係を結ぶ人々のドキュメンタリー制作を経て、よりメタ的な写真表現へと軸足を移してきた。
この変化の背景には、「見ることは個人的な知覚としてのみに限らず、社会的な機能をもつ」という気づきがあった。報道写真家として活動していた時期、国内で地震の被災地を取材し、そこで撮影した写真がマスメディアを通じて配信された。その情報が電力設備のダメージの特定と早期復旧にリアルタイムで影響を与えた。このような遠隔コミュニケーションを経験しながら、私は自身が共同体のセンサーとして機能していることを実感した。見ることは共同体の知覚網の一部を担う行為であり、共同思考することでもある。このような実体験が写真や視覚メディアの捉え方を根本から問い直すきっかけとなった。
このような経緯から、私の実践は目の前の現実を光学的に「写す」ことを必ずしも目的としない。むしろ、現実がいかに写され(再現)、そして移され(伝達)るのか、その視覚処理や表象化の構造と、個体レベルと共同体レベルにおける情報流通メカニズムを問い直す。換言すれば、〈窓〉に映る世界を語るだけではなく、その〈窓〉自体がどのような歪みや制約を持ち、私たちの視線をいかに規定するのか考えている。
ここで前提とするのは、視線とは生物学的に構築され、他者によって訓練され、社会で制度化された知覚のプロトコルであるということだ。私たちは世界を自由に見ていると思いながら、実際には社会文化的に選別された像の連なりを現実として内面化している。
画像生成AIは、人の集合的視線の履歴を学習し、再構成してフィードバックする鏡のようなものと言える《Typical World》では、「typical + ○○」というプロンプトによってAIが生み出す像を通して、バイアス、文化的ステレオタイプ、言語の強制力、そして私たち自身のものの見方の裏側を暴露する。そこに写るのは、AIという鏡像空間で反芻された風景である。個人の視線は記録され、複製され、分類され、やがて「典型」として制度化される。それは情報技術が織りなす、プラネタリーレベルの共同意識の現れである。
重要なのは、人の視覚受容体験が常に視覚情報技術によって変容してきたという事実だ。19世紀に写真機の発明がもたらした「視覚の再現自動化」は、当時の画家たちの意識をがらりと変え、印象派の画家たちは最も敏感に反応したはずである。彼らはもはや現実を正確に描き写す必要を失い、代わりに「見るという営み」そのものを分解し、再構築しようとした存在だと思う。モネやスーラの筆触分割は、ただ単に画面を明るくするための描写技法だけではなく、人の視覚神経のアルゴリズムをハックする試みでもあった。色と色の干渉により脳内で像が生成される過程は、AIが光や色、エッジの確率分布から特徴を抽出し像を生成するプロセスと構造的に類似する。
写真機の発明は人間の眼球の機能を外在化し、印象派はその「知覚の解体」に応答したように思う。今日、AIによる生成技術はさらに歩みを進め、視覚脳の知覚システムの構成そのものを自動化する。言い換えれば、印象派が筆触によって視覚のアルゴリズムを探求したなら、AIは演算によってそれを再実装する。私の関心は、この「技術史的な連続性の中で、どのように人の視覚が制度化され、再編成されてきたか(そして、されつつあるか)」にある。
私の視覚批評的実践は、ヒト・シュタイエル、トレヴァー・パグレン、ジェームズ・ブライドル、ジョアン・フォンキュベルタといったテクノロジー批判を中心に据えた作家と問題意識を共有しながら、一方で杉本博司、トーマス・ルフ、ジェフ・ウォールのように、写真メディアの制度性、時空間、知覚のあいだの関係性を扱う実践と共振する。こうした視覚をめぐる思索は、光学装置の歴史をたどることでも浮かび上がる。レンブラントやフェルメールといった画家たちがカメラオブスクラやカメラルシダを利用していたとデイヴィッド・ホックニーが示唆したように、私もまた写真機や画像生成装置の進化に伴走しながら、「見る、知覚するとは何か」という問いを更新しようとする視覚と技術の相互作用に向き合う芸術の系譜に位置している。
《あの海に見える岩を、弓で射よ》では、対象そのものよりも、「対象に対して“見る”という行為が向けられる構造」そのものを主題とする。「見せる者」によって誘導された「見る者」の視線が「見られる者」に向かって放たれ、ときに思いもよらない場所に突き刺さる。その構造的暴力を引き受けることこそが、視覚メディアが抱える根源的な倫理の場であると私は考える。
この問いはプラトンの「洞窟の比喩」にも通じる。私たちは、情報の壁に投影された影を現実と信じる囚人のように、テクノロジーが再構成した像を盲目的に「リアル」として受け取ってはいないだろうか。そして今日の影は、もはや無垢な幻などではない。それらはアルゴリズムによって巧妙に選別され、集合知によって強化され、ときに戦略的に設計された「認知戦」のツールとして働いている。
見るという行為への私の執着は、単なる文化的・美学的関心ではない。それは生命のレベルで刻まれた、より根源的な衝動に由来する。人間を含む多くの生物にとって「見ること」は、生存手段であり、世界を先読みするための武器であり続けた。私たちの視覚神経は、単に光を受け取る器官ではなく、敵を察知し、餌を見分け、危険を予測するために進化してきた生存のためのアルゴリズムである。つまり視覚とは、命を守るための即応的推論装置のひとつであり、このメカニズムこそが脳科学が示す「予測符号化」である。この理論は、人間の知覚を「受動的な入力」ではなく「生成的なモデル」と捉え直している。私たちは外界をそのまま見ているのではなく、常に世界を予測し、誤差を通じてモデルを修正し続ける。この観点からすれば、生成AIは人間の視覚システムのシミュレーターとして、現時点でもっとも正確にものを見ている装置と言えるかもしれない。
ユクスキュルが述べたように、生物はそれぞれ固有の「環世界(Umwelt)」の中で世界を経験する。人間の視覚もまた、文化的・生物学的条件によって構築された一つの環世界であり、客観的世界そのものではない。今日、AIの視覚が登場したことで、私たちは「人間とは異なる知覚体系をもつ他者」と世界を共有しはじめている。AIはデータから意味を抽出し、その内部で独自の環世界を形成しながら像を生み出す。その像は単なる模倣ではなく、異種の知覚体系が生成したもうひとつの世界である。私の実践は、人間と機械の環世界が接触するこの界面から見えるものを可視化する試みである。
ホモ・サピエンスが他種と決定的に異なっていたのは、見知らぬ他者と虚構(国家、貨幣、宗教、物語)を共有し、協力する能力だった。
その虚構共有能力を飛躍させたのが、視覚の共有システム、すなわち記号、文字、絵、そして写真であった。個人にとっては単なる表象物だが、共同体から見るとそれは社会的知覚を形成し、集合的意識を維持するための装置だった。
以上のように私の実践は、視覚情報伝達制度をその起源から見直しながら、テクノロジーによって拡張された知覚構造を再帰的に考える試みである。
2025.11.21 苅部 太郎
I am an artist working at the intersection of post-photography and the philosophy of technology, reexamining the systems embedded within AI and photographic media and their influence on human subjectivity.
I studied psychology at university, and after participating in infectious disease prevention programs for international NGOs in the UK and South Africa, I worked in the fields of finance and information technology at a financial institution. At first glance, this trajectory may appear fragmented. However, it is grounded in a continuous concern with invisible structures rooted in my undergraduate research on General Systems Theory and in a sustained commitment to the social issues of my time.
In 2015, I began working as a photojournalist. Through on-site reporting in disaster-affected regions and documentary projects focused on people forming relationships with artificial entities such as robots and dolls, my practice gradually shifted toward a more meta-level engagement with photography itself.
This transition was driven by a realization that seeing is not merely an individual perceptual act, but also a social function. While working as a photojournalist, I documented earthquake-affected areas in Japan. Images I captured were distributed through mass media and, in real time, contributed to identifying damage to electrical infrastructure and accelerating recovery efforts. Through this experience of remote communication, I became acutely aware of functioning as a sensor within a collective system. Seeing, I came to understand, is an act that participates in a communal perceptual network—an act of collective thinking. This lived experience fundamentally reshaped my understanding of photography and visual media.
For this reason, my practice does not necessarily aim to optically “capture” the reality before my eyes. Rather, I investigate how reality is imaged (represented) and transmitted—examining the structures of visual processing and representation, as well as the mechanisms of information circulation at both individual and collective levels. In other words, instead of merely describing the world visible through a “window,” I question how that window itself—its distortions and constraints—shapes and governs our gaze.
Underlying this approach is the premise that vision is a perceptual protocol: biologically constructed, socially trained, and institutionally standardized. While we believe we see the world freely, we in fact internalize sequences of images that have been culturally selected and socially conditioned.
Image-generative AI can be understood as a mirror that learns, reconstructs, and feeds back the historical accumulation of collective human vision. In Typical World, I employ prompts such as “typical + ○○” to expose, through AI-generated images, underlying biases, cultural stereotypes, the coercive force of language, and the hidden frameworks shaping our ways of seeing. What appears there is a landscape ruminated within an algorithmic mirror space. Individual gazes are recorded, replicated, classified, and eventually institutionalized as “typical.” This process manifests a planetary-scale collective consciousness woven by information technologies.
What is crucial here is the historical fact that human visual experience has always been transformed by visual technologies. The invention of photography in the nineteenth century automated visual representation and radically altered artistic consciousness. The Impressionists, in particular, responded acutely to this shift. Freed from the obligation to faithfully depict reality, they sought instead to deconstruct and reconstruct the act of seeing itself. The fragmented brushstrokes of Monet or Seurat were not merely techniques for brightness or atmosphere; they were attempts to hack the algorithms of human vision. The process by which images emerge in the brain through chromatic interference bears structural similarity to how AI extracts features from probabilistic distributions of light, color, and edges.
If photography externalized the function of the human eye, Impressionism responded by dismantling perception. Today, AI-driven generative technologies advance this trajectory further by automating the very architecture of perceptual cognition. Where Impressionists explored visual algorithms through brushwork, AI re-implements them through computation. My central concern lies within this technological-historical continuity: how human vision has been institutionalized and reorganized—and how it continues to be reshaped today.
My practice shares critical ground with artists such as Hito Steyerl, Trevor Paglen, James Bridle, and Joan Fontcuberta, whose work interrogates technology and power. At the same time, it resonates with practices by Hiroshi Sugimoto, Thomas Ruff, and Jeff Wall, who explore the institutional conditions of photography and the relationships between time, space, and perception.
This inquiry into vision also emerges through the history of optical devices. As David Hockney suggested regarding painters such as Rembrandt and Vermeer’s use of the camera obscura and camera lucida, I position my work within a lineage of artists who engage with evolving image-making apparatuses while continually renewing the question: what does it mean to see?
In Aim an Arrow at the Rock in the Ocean, my focus is not the object itself, but the structure through which the act of seeing is directed toward an object. The gaze of the viewer—guided by those who present images—is projected toward the seen, sometimes striking unexpected targets. I consider the acceptance of this structural violence to be the fundamental ethical site of visual media.
This question echoes Plato’s Allegory of the Cave. Are we not, like the prisoners, mistaking images projected onto informational walls for reality itself? Today’s shadows, however, are no longer innocent illusions. They are algorithmically curated, reinforced through collective feedback, and at times strategically engineered as instruments of cognitive warfare.
My fixation on the act of seeing is not merely cultural or aesthetic. It stems from a deeper, biological impulse. For many living beings, vision has always been a tool for survival—a means of anticipating the world. Human visual systems evolved not simply to receive light, but to detect threats, identify resources, and predict danger. Vision is thus an immediate inferential apparatus for survival, corresponding to what neuroscience describes as predictive coding. Perception, in this view, is not passive reception but an active generative model, constantly revised through error. From this perspective, generative AI may be understood as a simulator of human visual cognition—and perhaps, at present, as one of the most precise machines for “seeing.”
As Jakob von Uexküll argued, every organism inhabits its own Umwelt—a species-specific perceptual world. Human vision, too, constitutes one such Umwelt, shaped by biological and cultural conditions rather than objective reality itself. With the emergence of AI vision, we are beginning to share the world with an entity possessing a fundamentally different perceptual system. AI extracts meaning from data and forms its own internal Umwelt, generating images that are not mere imitations, but manifestations of an alternative perceptual order. My practice seeks to visualize what emerges at the interface where human and machine Umwelten come into contact.
What distinguished Homo sapiens from other species was the ability to share fictions—nations, money, religion, narratives—with strangers and cooperate at scale. The leap in this capacity was enabled by shared visual systems: symbols, writing, images, and photography. While these are representations for individuals, at the level of the collective they function as apparatuses that shape social perception and sustain collective consciousness.
In this sense, my practice reexamines systems of visual information transmission from their origins, while reflexively interrogating perceptual structures expanded and reorganized through technology.
2025.November.21 Taro Karibe