AutoCAD'den Midjourney'e Yapay Zeka Çağında Mimarlık

PINAR ONGUN OZAN ERTUĞ FERHAN YALÇIN

"Synthetic Architecture" isimli Instagram hesabındaki paylaşımlarıyla dikkat çeken Pınar Ongun ve Ozan Ertuğ ile, günümüzdeki yapay zekâ devriminin mimarlık alanındaki etkilerini; mimarlığın dijital dönüşüm sürecinde, 2000'li yılların başında başlayan dijitalleşmeden, yeni nesil programlara geçişle ilgili düşüncelerini ve deneyimlerini konuştuk.

Ferhan Yalçın: Başlarken belirtmek istiyorum kendi cahilliğimi giderecek birkaç soruyla başlayacağım. Neslimden veya yapay zekâ ve dijitalleşmeye ilgimden dolayı cahillik olarak tanımlıyorum bu bilgisizliği. Son zamanlarda “herkesin her şeyi bilmesi” üzerine bir şeyler yazmak istedim ama bu söyleşi bu “her şeyi bilme” halini daha başka yerlere götürecek diye düşünüyorum.

Sizi kısaca tanıyabilir miyiz? Ben sosyal medyada “Synthetic Architecture” isimli hesabınızdaki üretimlerinizle tanıdım sizi, belki bu alandan da bahsetmek istersiniz.

Ozan Ertuğ: Merhaba, ben Ozan Ertuğ, YTÜ mezunuyum ve GAD Tasarım Departmanı şefiyim. Pınar Ongun ile birlikte yürüttüğümüz Synthetic Architecture isimli Instagram hesabında mimarlık alanında yapay zekâ destekli tasarımın yaratıcı potansiyelini keşfetmek için yaptığımız çalışmaları paylaşıyoruz.

Pınar Ongun: Merhaba, ben de çeşitli üniversitelerde mimari tasarım stüdyo yürütücülüğünün yanı sıra ahşap üretim teknikleri alanında çalıştım. GAD’da Mimari Sertifika Programı'nı kurarak oradan ayrıldım. Son bir yıldır, Ozan’la birlikte yapay zekâ üstüne okumalar ve üretimler yapıyoruz.

FY: 2000’li yılların başında dijitalleşmenin artmasıyla; üretim, kendini ifade etme ve temsil araçları için büyük bir dönüşüm içerisine girdik. Günümüzde ise bambaşka bir süreç ile sarsılıyoruz diyebiliriz sanırım. “Yapay zekâ” çok geniş bir kavram ama mimarlık alanı için yeniden nasıl tanımlayabiliriz?

OE: “Milenyum” olarak atfedilen ama belki de doğrusu “üçüncü milenyum” olması gereken bu yeni yüzyıl, pek çok alanda olduğu gibi mimarlık üretimi açısından da yepyeni ufukların habercisi oldu. Ama aslında dijitalleşme dediğimiz sürece paralel olarak “bireyselleşme” süreci de bu dönemle birlikte sanki hızlanmaya başladı. Birçok gelişimin/gerilemenin yanında, ben bu "dijitalleşme x bireyselleşme" çiftini birlikte ele almanın doğru olduğunu, çünkü birbirini besleyen ve kuvvetlendiren bir çift olduklarını düşünüyorum.

Ve bu süreçler teknolojik, yani yazılımsal ve donanımsal desteğe ihtiyaç duyuyorlardı. Teknolojik gelişimin sürecinde donanımsal eksiklikler yazılımla ve yazılımın aşamadığı eşikler de donanımsal gelişimlerle giderilir. Dolayısıyla bu ikili de aslında önemli ve birbirini tamamlayan, güçlendiren çift halinde gelişmek zorundaydı. Ben bir üçüncü çift olarak da buraya insan ve makineyi koymak istiyorum. Ve önceki çiftler için söylediğim her şeyi aynen tekrar ediyorum: Birbirini besleyen ve ilerleten önemli bir çift, "insan x makine".

Günümüzde biz yapay zekânın gelişmesine tanık olduğumuzu düşünüyoruz ama bence insan gelişiminde gelinen bir tıkanmanın yansıması olarak "insan x makine" çiftinin enerjisi makine tarafına kaymış durumda. Makine kuvvetlendiğinde gücünü bence tekrar insanlığa aktaracaktır.

Burada yapay zekâ, makinenin yazılım ve donanım çiftine bağlı gelişim sisteminde yoğunlukla yazılım tarafını temsil ediyor, geçen zamanlarda kuantum bilgisayarlar, VR/AR vb. gelişimlerin nasıl heyecan yarattığını, ancak alışkanlıklarımızı etkileyecek kadar hızlı ilerleyemediğini gördük; çünkü var olan yazılımlarla daha hızlı ilerlemek ve pratik sonuçlar almak mümkün değil. O yüzden makinenin arka planında güç akışı yazılım tarafına kaydı ve şu anda yapay zekâ çalışmalarının meyve vermeye başlaması çok doğal.

Peki mimarlığın da aslında bilgisayar destekli üretimler açısından önemli bir çifti yok mu, pek tabii ki var. Bunu mimarlığın “simülasyon x uygulama” çifti olarak ortaya koyabiliriz. Peki özellikle simülasyon tarafında etkili olan yapay zekâ desteğinin sonucu ne olacak derseniz, ben mimarlıkta yazılımsal bir güncellemeye başlayacağımızı düşünüyorum. Yapay zeka aracılığıyla artık daha akıllı (miyadını dolduran içi boşaltılmış bir terim olsa da) programlarla tasarım yapmanın bir sonraki adım olabileceğini söyleyebiliriz.

Repurposed Marble Quarry (Yeniden İşlevlendirilen Mermer Ocağı) - Midjourney

FY: Bugün herkeste bu her şeyi bilme halinin getirdiği bir “yapay zekâ imajı” var, bu imaj hakkında neler söylemek istersiniz?

OE: Yapay zekâ alanında şu an için adı en çok tekrar edilen platform, OpenAI tarafından geliştirilen ChatGPT. Microsoft'un bir kısmına sahip olması biraz rahatsız edici olabilir, ancak bu platform AGI (Güçlü Yapay Zekâ: İnsan zekasından öte kabiliyetler geliştirebilen yapay zeka) olmaya en yakın aday. Şu anda halka açık bir demosu var ve biz de bu platformun dördüncü versiyonuyla etkileşim içindeyiz. ChatGPT'yi hayatınızda açıp kullanmamış olabilirsiniz ama emin olun ChatGPT dolaylı olarak da olsa bir emailinize cevap yazmış ya da buna benzer bir veri girdisi yoluyla sizinle iletişime geçmiştir. Burada bir ürperme hissedip hissetmediğinizi bilmiyorum ama ben mesela Pınar’a ilk kez ChatGPT'yi anlatıp onun ne kadar harika olduğunu (!) sınamasını istediğimde çok hızlı ve kötü bir sonuçla karşılaştım; yaptığı bir ya da birkaç alıntının uydurma olduğu, alıntıyı yaptığı metinler incelenerek anında ifşa edildi. Burada aldığım ders çok önemliydi; ChatGPT, her şeyi bilmekle övünüp aslında kopuk bilgi parçalarına haiz olan, araları çok iyi dolduran ve de üstüne hitabeti kuvvetli olan, belki de çoğumuzun sahip olduğu o etkileyici arkadaş/mentor(umsu) tipe çok benziyor. Bir yere kadar eğlenceli olsa da bu tip insanların güç zehirlenmesiyle neye dönüşebileceklerini tahmin edebilirsiniz. ChatGPT, toplumumuzun girdileri, düşünceleri, önyargıları vs. her şeyle beslenmiş ve maalesef en başta değil öğrenme sonrasında bu konulardaki etik bozuklukların üzerine gidilmiş bir platform. Yine de insan yansımasının kendini beğenmiş karakterine ters olarak alçak gönüllü bir tonla, yanlışı yakalandığında üste çıkmaya çalışmak yerine özür dileyen bir üsluba sahip. Bunun müşteri ilişkileri açısından en sorunsuz yaklaşım olması da başka bir ayrıntı tabii ki!

FY: AutoCAD benim öğrencilik yıllarımda devrim diyebileceğimiz bir programdı. Yapay zekâ ile AutoCAD veya buna benzer hangi uygulama ve programların dönemi kapanacak sizce?

OE: Tasarım, prototip, görselleştirme ve inşaat konularında hantal ve yorucu programların kölesi olduğumuzu gözlemliyorum. Burada da yine birbirinden beslenen “edebiyat x matbaa” çiftini örnek olarak kullanacağım. Birçok ofis mimarlığın “edebiyat” diyebileceğimiz tasarım felsefesi, ekolojik bilinçlilik vb. konularından çok “matbaacılık” diye adlandırdığım uygulama dokümantasyonu ve görselleştirme konularında iş gücü çalıştırıyor. Doğal olarak da kullandıkları programlar buna yönelik.

Özellikle uygulama dokümantasyonu ve görselleştirme konularındaki bu ciddi iş yükünün, yapay zekâ destekli süreçlere kaydırılması gerekli ki biz insanlar olarak tasarım felsefesi ve diğer önemli meselelere gereken zamanı ayırabilelim.

Yani bu demek oluyor ki şu anda uygulama çizmek için, etkileyici görseller elde etmek için kullandığımız programlar ya tamamen nostaljik antikalar haline gelecek ya da dönüşecekler. Mesela her ne kadar grafik programı olsa da görselleştirmenin belkemiği olan Photoshop gibi, iş ilanlarının da gözbebeği olan programların üreticisi olan Adobe, oldukça iyi bir dönüşüm geçirdi. Zaten bu dalgayı en iyi yakalayan iki firmadan biri Microsoft, diğeri ise Adobe oldu. Ancak büyük firma alışkanlıklarıyla hareket etmeleri, hala tam olarak dalganın kalbinden çıkmadıklarından, onlar için de değişime yeterince hızlı ayak uyduramama tehlikesini barındırıyor.

Spesifik konuşacaksak Autodesk Revit liderliğindeki BIM programlarının çağın oldukça gerisinde kaldığını düşünüyorum. Henüz BIM konusunda yaygın bir AI destekli alternatif olmasa da Çin’de bu konuda ciddi çalışmalar yapılıyor. Mesela, görselleştirmenin lideri olan Chaos’un yapay zekâ entegrasyonu konusunda ne yaptığı meçhul, çünkü bu yazılımın donanım karşılığı olarak bel bağladığı çip üreticisi NVIDIA, her zaman olduğu gibi dalgayı çok iyi yakalayan ve AI döneminin donanım konusunda liderliğini yapan yegane firma. Rhinoceros mesela, Mario Carpo’nun deyimiyle “spline” sonrası mimarlığın en önemli araçlarından ve enteresan bir şekilde henüz bulunduğu yerde hak iddia eden bir AI destekli yazılım yok, ancak text-to-3D ve img-to-3D kazanları fokurdamaya devam ediyor.

FY: Mesleki anlamda yapay zekâ ile hayatımıza neler girdi ve daha bizi neler bekliyor? Nelerden korkmalıyız?

OE: Mesleğin gereklilikleri aslında aynı; müşteri, kullanıcı, yakın çevre ve doğa dikkate alınarak tasarım, geliştirme, uygulama, dönüşüm vs. gibi konularda, bazen finansı sağlayan müşteriye rağmen, bazen de onun desteğiyle bir uzlaşı ortamı yaratmak. Bu anlamda uzlaşı için görsel ve teknik dokümanlar üretilmesi ve sunulması, ayrıca bunların değişik istek, arzu ve ihtiyaçlar doğrultusunda opsiyonlarının olması gerekli. Sonuçta mimarın yaptığının, yaşam senaryoları içeren çok opsiyonlu simülasyonlar oluşturmak olduğunu ve uzun çabalar sonucunda bu simülasyonun belirli bir opsiyona odaklanmış halinin gerçek dünyada materyalize edildiğini söyleyebiliriz. Peki bir simülasyonun her opsiyonu için ne kadar zaman harcayabilirsiniz? Çünkü mimari bir üretimdeki diğer paydaşların mimar üzerindeki en büyük baskı aracı zamandır. Tüm opsiyonları içermeyen bir simülasyon başarısız mıdır ya da en doğru seçenek bulunana kadar uğraşılıp üretim sekteye mi uğramalıdır?

Tüm bu sorular ışığında yapay zekâ şunu vaat ediyor, ya da en azından akıllıca kullanımı şu konuda yardımcı olacaktır; simülasyonlar hızla oluşturulabilirse eğer, düşünmek için zaman kalacaktır. Belki de simülasyonu yerle bir edip baştan kurmak hiç de korkutucu bir şey olmayacaktır. Çünkü tasarım ve diğer süreçler o kadar enteresan hamallıklarla uzuyor ki, kullandıkları simülasyonlar sorunların değişmesine göre adaptasyon yeteneklerini kaybediyorlar ve zamanın belli bir diliminin gereklilikleri ve önceliklerinde hapsoluyorlar. Burada etik, estetik vb. öncelik ve değerlerden bahsetmiyorum; dediğim gibi, zaten bunların dışındaki diğer sözde gereklilik ve öncelikler aradan çıkarsa biz de asıl zaman harcamamız gereken yerlere odaklanabiliriz.

Kendini eğiten, meraklı bireylerin korkmaları gerektiğini düşünmüyorum. Hatta bu dönemin oluşturduğu korkutucu bazı canavarların da yavaşça ortadan kalkacağını düşünüyorum. Mesela eskiden “data scientist” adlı gözde bir mesleğin geleceğin en önemli mesleklerinden olduğu söylenirdi. Yakın zamanda da favorimiz “prompt engineering” olageldi. Ancak yapay zekâ, onu anlamak için taklalar atmanızı istemiyor, sizinle diyalog içerisinde olmak ve isteklerinizi anlamak için geliştiriliyor.

Mesela en son ChatGPT ile Instagram için görsel üretirken, daha önce Midjourney platformunda sıkça yaşadığım "kopuk kelime salatalarıyla" istediğimi elde etmek için gösterdiğim çabalar, edebi bir dille mekân tasviri yaptığım, daha keyifli bir sürece dönüştü. Hatta mekân tasvirleriyle ilgili literatüre göz atarak, gerçekten diyalog yoluyla senaryo üretimi yapabildiğimi fark ettim. E tabii ki bu bana gösteriyor ki “şu anda var olmayan ama gelecekte çok önemli olacak 10 iş” başlıklı clickbait'lerin gözdesi “prompt mühendisliği” mesleği de yavaş yavaş silinecek. Kendi kolumu kesmek gibi olacak ama parametrik tasarım ve kodlama uzmanlarının yerini de edebiyata, heykele, sanata hâkim olan, çevre bilincine sahip, ne gördüğünü, gördüğünün neden daha iyi ya da kaliteli olduğunu anlayan, mekânın insan üzerindeki psikolojik etkilerine hâkim profesyonellere bırakacağını düşünüyorum. Elbette kaputun altındaki karmaşık işleri yapacak insanlar olacaktır ama her çocuğun da kodlama bilmesi anlamsız. Bu çok iddialı olabilir ama benim bütün kariyerim bu yönde evrildi.

Son olarak şunu söyleyebilirim: Bir şeyin öğrenme eşiği yüksekse orda gelişime açık bir yer vardır, demek ki bu pratiğin içerisinde gereksiz bürokrasiler ve hantallıklar vardır ve bunlar otomatize edilmelidir.

FY: Ofisinizde daha önce aktif olarak kullandığınız ancak yapay zekâdan sonra vazgeçtiğiniz uygulama ya da programlar var mı? Gündelik hayatta veya ofisinizde yapay zekâ programlarından hangisini/hangilerini kullanıyorsunuz?

OE: Henüz vazgeçtiğimiz bir program yok ancak mesela Enscape ve Twinmotion’ın kullanım sıklıklarında azalma hissedildiğini söyleyebilirim. 3ds Max üzerinden yapılan ağır görselleştirme süreçleri zaten bir darbe almıştı (bunu fark eden Chaos, Enscape yazılımını satın aldı).

Daha fazla eskiz ve maket yapabiliyoruz; bir dolu kalemi, cetveli vs saklandıkları yerlerden çıkardım. Zaten plan çizimi (şimdilerde Revit’le yapılan) meselelerini de daha sonra yapay zekaya devretmek üzere belli kişilere yaptırdığımız için (işin doğası gereği) şimdilik yerinden olan bir şey yok. AutoCAD ile kamunun bize şifreli olarak gönderdiği yapı stoğu elde etmek için belirledikleri kurallar ve çerçeveleri inceliyoruz mesela, onun dışında bazen mind-mapping yapmak için de çok kullanışlı olduğunu fark ettik.

Yeni kullandığımız programlarsa; görselleştirme hızı çok iyi olduğu için storyboard yapma programı olarak addedebileceğimiz Midjourney, DALL·E ve ChatGPT. Midjourney daha “yaratıcı” ama daha garip bir dille iletişim kurduğumuz platform, DALL·E ve ChatGPT ise diyalogla ilerleyebildiğimiz ama imaj işleme teknikleri henüz iyileşemeyen programlar. ControlNet gibi eklentilerle Stability AI bazlı yazılımları kullanarak bir eskizi ya da 3d modeli (aslında yaptığı modelin o anki görüntüsünü baz almak) farklı malzeme ve durumlar içerisinde görebiliyoruz. Elde ettiğimiz görsellerin sorunlu kısımlarını, gerçekliğe uymayan bölümlerini Photoshop içerisinde “Generative AI” yardımıyla çözüyoruz. Bir de Çin’de çok önemli çalışmalarda şaşırtıcı sonuçlar veren LookX var (aslında Stability AI ve ControlNet modellerinin arayüzü biraz); potansiyeli yüksek ama sonuçları daha uzun dönemde alınacak çalışmaları var. Biz de firmanın Türkiye’deki temsiliyetini üstlendik ve bu konuda çalışmalar yapıyoruz.

Bunun dışında Pi.ai ile sesli diyalog konusu keyifli ve aslında dönüştürücü bir doğaya sahip (bu hissin biraz uç versiyonunu, Spike Jonze “Her” filmiyle çok etkileyici bir şekilde hikayeleştirdi, yine de Pi.ai kullanırken bazı tekrarları ve patternleri keşfettiğinizde büyüsü çabuk bozulabiliyor). Bazı text-to-video (RunwayML, PikaLabs) ve text-to-3d platformlardan iyi sonuçlar alınıyor. Daimî bir devinim içerisinde olduğundan hepsine kısıtlı zamanlar ayırıp sert bir elemeden geçirmemiz gerekiyor, bazen daha önce beğenmediğimiz bir program iyileşmiş haliyle tekrar eleme sürecine dahil edilebiliyor.

Floating Farming Communities (Yüzen Tarım Toplulukları) - DALL·E 3

FY: Ben Midjourney gibi programları yeni bir temsil aracı olarak görüyorum. Bir kitabın filme dönüşmesi gibi, başka bir gözden bize başka şeyler anlatıyor gibi geliyor... Siz Midjourney ve benzeri programları nasıl tanımlarsınız?

OE: Midjourney platformu, üretim biçimi olarak mekân tasvirini kullandığı için (şu an için DALL·E 3 daha iyi bu konuda) çok uzun zamandır böyle bir şeye hazırdık. O heyecanla göz açıp kapayana kadar bir yıl içerisinde neredeyse 50 bin kez üretim yapmış olduğumuzu fark edince biraz şaşırdım. Biraz farklı bir örnek olacak ama şöyle bir his vardı bende; dedektiflik temalı yapımları izlerken en çok endişe duyduğum şey, bir gün benden bir kişiyi tasvir etmem istenmesidir. Çünkü o tasvirlerle robot resmi çıkarılması benim için akıl alır gibi değil. İşte Midjourney, sizin görmek istediklerinizin resmini çizen bir illüstratör gibi; tarif ediyorsunuz ve bir şeyler resmediyor. Büyük çoğunlukla “pek olmadı ama bu da fena değilmiş” kalitesinde çizimler yapıyor. Tam da o noktada kapılıp gitmemek lazım, sonuna kadar istediğinize yakınlaşmak için uğraşmak gerekli. Biz (burada Pınar’ın da Instagram üretimlerinde eşdeğer bir katkısı var) bir yandan da bu felix culpa çıkarımları kenara alıp onları tasvir ve onun yansımalarını anlama mahiyetinde eşeliyoruz. Yani hem kendi istediğimizi hem de bu yaratıcı platformun garip algı bozuklukları arasındaki sentetik yaratımlarını değerlendiriyoruz.

Geçen hafta itibariyle DALL·E platformunun 3’üncü versiyonu, ChatGPT 4.0 ile entegre oldu. Bu çok önemli bir gelişme çünkü Midjourney ile yapamadığımız şey tarife dayalı bir robot resmi çizememekti, DALL·E 3 ise daha iyi anlayan bir çizer. Çünkü tercümanı var yanında; ChatGPT.

ChatGPT ve DALL·E ile ilgili bir diğer heyecan uyandıran nokta ise artık filanca mimar gibi yap komutunu dikkate almıyor ve bunu yapmayacağını belirtiyor. Bu sadece mimarlar için değil ünlü grafiker ve çizerlerin, fotoğrafçıların isimleri için de geçerli. Bu sizi yapmak istediğiniz şeyin ne olduğunu anlamaya yönelten çok değerli bir düzenleme. Çok kaba bir tabirle bu işe ilk başladığımda yapay zekâ ortamlarında gördüğünüz her şey “designed by Zaha Hadid” şeklinde promptlanıyordu ve bir yerden sonra bu “Hadidian” gelecekle ilgili üretimlere ilgi duymamaya başladık.

Yapay zekâ ile diyalog demek literatüre hâkim olmak demek, farklı ve çeşitli kelimelerden doğan şeyleri incelemek çok önemli. Ev, rezidans, kondo, loft gibi benzer bir şeyin farklı kelime ve tümce varyasyonlarını görsel üretmek için bu platformlarda kullandığınızda, bunun ne demek olduğunu daha iyi anlayabilirsiniz.

FY: Bu anlamda “temsil” meselesinin geçmişi ve dönüşümü hakkında ne düşünüyorsunuz?

PO: Mimarlıkta temsiliyet her zaman karmaşık bir konuydu gibi geliyor. Sanatta olduğu gibi kendinde bir hali yok. Temsil nesnesini sanatta yaratıcısından ayrı ele alabilirken bunu mimarlıkta bir türlü bırakamıyoruz. Bu da tasarım ve üretim sürecinin ve hatta temsil sürecinin de kollektif olamamasına sebep oluyor. Midjourney kullanan herkes biliyor ki, kendisi söz dinlemiyor. Ona hayal ettiğim bir kamusal alanın metnini yazıyorum ve bekliyorum. Onun bana sunduğu seçki, arama motorlarının uçsuz bucaksız veri belleğinden kendi algoritmasında bir temsil biçimi. Ve tamamıyla kollektif. Bu üretimi ben yapmadım, Midjourney de yapmadı. Arama motorunda olan bir bilgi, bir görsel, bir edebiyat metni, bir film, bir şehir, bir kişi, bir zaman dilimi orada bir yerde yazdığım metinle çarpıştı. Bana ilginç gelen kısmı ise, bir temsil ürününü bir kez daha aynı şekilde üretemiyor olmak. Bu yeni kapılar açabilir.

Kısacası AI’da temsiliyet biçimleri sonsuz ve bu temsilleri üretenler muğlak. Sanıyorum kıyamet buradan kopuyor. Ama bu şerde bir hayır görmek isteyenlerdenim. Belki artık bu çokluk ve muğlaklık, yaratıcı egosundan sıyrılıp mimarlığı daha kollektif ama bir o kadar kendinden mütevellit bir şey yapabilir. Deneyimlerken göreceğiz.

FY: Midjourney’in çalışma biçimi hakkında neler söylemek istersiniz? Midjourney’de bir projeye başlamanın kaç hali var ve siz nasıl başlıyorsunuz? Yaptığınız işin üretim sürecinin etik hallerini nasıl değerlendirirsiniz?

OE: Sanattaki üretim gibi “kopyalamak” bu işin training kısmında çok önemli. Bunu bir tür vücut geliştirme sürecine benzetebilirsiniz, gözleriniz yanmaya başladığında bir şeyler öğreniyorsunuz.

Ancak kopyalamayı, benzeştirmeyi bir yerde bırakmak ve “nesnelerin doğası”na geçmek, daha önce söylediğim gibi “mekân tasviri”ne başlamak çok çok önemli. Kopyaların oluşturduğu bulanıklık tehlikeli ve bağımlılık yapıcıdır; kişi, taklitlerden kurduğu bu dünyaya inanarak eklektik ve ortalamaya yönelik bir kabullenme içine girer.

Mesela sağlıklı bir kullanım yöntemi olarak şunu yapıyoruz: Malzemeleri ve onların almış oldukları formları ne olarak anladığını sorarız Midjourney vb. platformlara. Buna "reverse engineering" diyebiliriz ve bir tabloyu, görseli, fotoğrafı, illüstrasyonu ya da mimari eseri de böyle irdeleyebilirsiniz. Ancak çoğu zaman yaptığı tasvir girdiğiniz imajı anlatmaktan biraz uzak olacaktır. Bu bir tasarım elde etme yöntemi midir diye sormak lazım. Amacınız kendi tarzınızı (hibrit dahi olsa) oluşturmak mıdır yoksa aynı "prompt engineering" meselesinde olduğu gibi kelime salatalarının en şaşaalı görseli oluşturduğu versiyonlarını cebe atıp yola devam etmek midir? İkinci seçenek çok çekici bir yol ama doğru değil.

Başka bir yöntem de yeni bir dili öğrenmek için kullandığımız sorulara başvurmak: Yabancı bir yerde “'Ahşap doğrama' sizde nasıl söyleniyor?” dersiniz mesela, eğer hâkim değilseniz o dile. Şifre kırıcı gibi hareket edip nesnelerin karşılığı olan kelimeleri denemek lazım, bazen Almanca, Fransızca veya İspanyolca karşılıklarına bile başvurulabilir. Bazen de çok yaygın kelimelerin ağır bir etkisi var, onlardan uzak durmak gerek! “Beton” kelimesi ya da “ev” kelimesi o kadar baskın ki, mesela “3d beton yazıcı ile örülmüş bir duvar” isteğine muhakkak beton kalıptan çıkmış bir duvar görseliyle karşılık verecektir. Böyle problemleri aşmaya çalışmak çok keyifli.

Bazen bir sanat akımını, bir dokuyu inceleriz; nasıl elde edebileceğimizi. Bazen mimari bir akımın nesneleri nasıl şekillendirdiği üzerinden akımı bileşenlerine ayırırız, müdahalelerde bulunup başka akımların istediğimiz parametreleriyle bütünleştirip hibrid bir bütünleşme elde ederiz. Ama işin sonu tüm bu üretimlerden seçim yapmak.

Seçim yapmak, ya da kürasyon (burada daha önce dediğim gibi kürasyon Pınar’ın işi) aslında sürecin her katmanında geçerli. Ben de ilk üretimlerden çıkanları kürate ediyorum; kalite kontrolden geçirip, belki resim düzenlemesi yapıp, hatalarını düzeltip kürasyona yolluyorum. Küratör bunların çoğunu çöpe atıyor. Üretimimin %90’ı öylece arşivlerde durur. Yani günde bir üretim yapmak için (özel olarak Instagram’ı kastediyorum) en azından 10 konunun storyboard’unu hazırlamış olmam gerekli.

Storyboard hazırlamak, aslında Arthur Eddington’ın 1820 yılında Edinburgh Review Dergisi'nde kullandığı bir terim olan “worldbuilding” ya da “kurgusal dünya yaratma süreci”nin görsel sanat dallarındaki karşılığı. Bizim üretimlerimiz sırayla yapıyı anlamak, içinde bulunduğu coğrafyayı, bulunduğu zaman dilimini, gereken iç ve dış mekân tasvirlerini kullanmak, görselleri elde etmek ve doğru sıraya koymak şeklinde. Tabii ki bir yapının görsel ifadesini elde ettikten sonra, “hadi şimdi iç görsellerini de üret” şeklinde yaklaşılmıyor meseleye. Yapay zekâ farklı malzemeleri gerçekçi detaylarla (ya da öyleymiş gibi görünen ama zoom yaptığınızda deli bağı gibi olan çizgilerle) çözebiliyor. Ama hangi malzeme neyle iyi gider kararı onun bileceği bir şey değil normalde, isterseniz onu da en başta bir tavsiye olarak (ön yatırım maliyeti açısından mı, ekolojik olarak mı gibi kabullerle) sorabilirsiniz. Her zaman olduğu gibi, pek güvenmeyip söylediklerini kontrol etmenizde yarar var. Ama her ciddi kararda ona danışmanız, sizin süreçteki varlığınızı kendi kendinize tehdit ediyor olmanız anlamına gelir ve bunu yapmak bir yerden sonra bazı yetilerinizi kaybetmenize yol açacaktır.

FY: En çok merak ettiğim konu “veri” meselesi aslında. Siz kendi verinizi üretebiliyor musunuz? Veriyi toplamaya başlarken nasıl bir soru ile başlıyorsunuz? Verinin etik toplanması mümkün mü? Veya tüm bu etik toplamanın sonucunda verinin sonuç vermemesi gibi problemler ne gibi sonuçlar doğuruyor?

PO: Verinin etik toplanması hiç şüphesiz ki mümkün. Biz bunu etik yollarla yapmak istiyor muyuz sorusunu kendimize sormamız gerekir. Metin bazlı yaratıcı programlar olduğu için birikim çok önemli. Okumuyor, yazmıyor ve gözlemlemiyorsam nasıl yaparım? Burada asıl soru, etik bir ürün elde etmek mümkün mü? Bu tartışmaya çok açık. Üretim nesnesi; metin, kollektif database ve algoritma üçlüsü ile çalıştığı için, her defasında farklı veriyi kullanan AI generated program verilerinin, etikliğinin kontrol edilmesi güç. Çünkü biz her yazdığımız veriyi programa gömülü olarak bırakıyoruz. Diğer taraftan da bir tez ya da paper yazma sürecine de benziyor; intihal yapmadan nasıl Richard Sennet’in fikirlerini kendiminki ile buluşturuyorsam, aynısını yapıyorum. Ama belirtmeliyim ki, neler olup bittiğini anlamak için Al’ın her halini deneyimliyoruz. ChatGPT’den “bana Mies gibi bir bina yapmayı anlat” cümlesinin yazılı verisini alıp, Midjourney’de kullanınca çok net ve doğru sonuçlar elde edebiliyorum. Bu benim Mies’in yapılarına baktığımda onları tanımlayacak üç cümleyi yan yana getiremediğimi gösteriyor, intihal yaptığımı değil.

OE: Ben bazı yalıtılmış ortamlarda nesnelerin doğasını anlamak için “unorthodox” yöntemlerle denemeler yapıyorum ve bunu da her daim düşünce sürecimde orda tutuyorum. Ancak bu yalıtılmış ortamdan yalnızca bazı süreçlerden geçirilmiş ve mümkün olduğunca etik olumlamasını yapabildiğim çıkarımlar elde etmeye çalışıyorum. Bir binanın, XXI gibi bir magazinde kullanılmış iyi bir tasvirini kullanıp sonuçlarını irdeliyorum ve siliyorum. Çünkü ne kadar güzel bir çıkarım da olsa hukuktaki tabirle “yanlış elde edilmiş delil” değerinde, çıkan üretim ne kadar güzel de olsa kullanılamaz. Amacım nesnelerin doğasını kavramak ve bunu da mekân tasviri yaparken kekelememek ya da daha yaratıcı olmak için yapıyorum.

Son olarak da yeni gelen bir yenilikle bu platformların baz çalışma kütüphanelerinden artık kendi üretimlerinizi çıkarttırabiliyorsunuz. Eğer itiraz edenleri rahatlatmak için yapılmış bir PR hamlesi değilse iyi bir adım sayılır.

Timber Bookstores (Ahşap Kitabevleri) - Midjourney

FY: Son söz olarak; sizce yapay zekâ ile günümüzde ya da öngörülemeyen gelecekte nasıl müelliflik problemleri ortaya çıkacak? Müelliflik meselesinde yapı tanımı veya mimarlık ve şehircilik alanları için yeni yasalar gelmesi gerekiyor mu? Geleceğin organizasyonları sizce nasıl değişecek?

OE: Müelliflik aslında, dönemimizin kuralları çürütülmüş, etiği zayıflatılmış konusu ve şu anda çok önemli. İlerde de önemli olacak ama sanki şu andaki patent koruması kisvesiyle değil. Yani bilgiye çabuk ulaşılabildiğinden, birisi sizin eserinizi alıp başka birine sizi referans vermeden sunduğunda, otomatik olarak geri çevrilebilecek. Eğer o anda fark edilmezse bir yerde bir başkası fark edebilecek.

Belediyelerin gelecekte hem etik hem de estetik kurulları olabilir mesela, tabii tarif ettiğimiz gelecekte belediyeciliğin artık yapay zekayla yapıldığını hayal ediyoruz. Belki demokrasinin yansımasında da kısmi temsiliyet yerine bireyin doğrudan temsiliyeti ve müdahalesi söz konusu olduğunda, yakın çevresi ile ilgili de karar verebildiğinde tüm bu konular daha keyifli hale gelecek. Bu mesele tabii bizim alanımızdan biraz başka yerlere doğru kayıyor ama yine de aklımızın kenarında tutulması gerekli.

Sanıyorum ki şu sıralarda görselin kaynağını bulmakla ilgili bir çalışma var; “Content Credentials”. Pınar bunu gündemimize getirdi. Çok önemli bir çalışma. Bunun yanında özellikle de “yayınlama”nın öneminin altını çizmek gerek. Bir fikri, üretimi, görseli bir yerlerde yayınladığımızda aslında müellifi olmuş oluruz, intihal yapıp yapmadığınız yine bir ihtilaf olması durumunda değerlendirilecektir ama oraya zamanda bir ayraç koymuş olursunuz; “bu fikir bu tarihte şu kişi tarafından toplumla paylaşıldı”. Bu bence müellifliğin en basit onanması. Saygılı, medeni bir toplumda bu ve bunun gibi yöntemlerle, kanuni ön tedbirlere gerek duyulmadan problemler çözülebilecektir.

FY: Teşekkürler…

OE ve PO: Biz teşekkür ederiz, bu hızlı tempoda bu güzel sorularla pek fazla zaman bulamadığımız bir şeyi yaparak üretim sürecine dair fikirlerimizi toparlamış olduk.

Etiketler: