Beschrijving foto’s met Artificial Intelligence vanaf nu

Aan Artificial Intelligence valt niet meer te ontkomen: alles ademt tegenwoordig bij wijze van spreken Kunstmatige Intelligentie.
Het is een mooi gereedschap, mits verstandig gebruikt, in het arsenaal van een fotograaf.
Eén van de mogelijkheden tegenwoordig is het maken van een beschrijving bij een afbeelding en dus ook een foto.

Je moet wel onder een hele grote steen leven wanneer je nog helemaal niets hebt meegekregen over (de ontwikkelingen) van Kunstmatige Intelligentie of, meer bekend, de Engelse term: Artificial Intelligence, afgekort met AI.

Met ingang van vandaag zal er bij geselecteerde foto’s een beschrijving komen die gegenereerd is door de app JoyCaption, een zogenaamd Visual Language Model (VLM).
Het is ondoenlijk om bij elke foto die op deze website staat een beschrijving te laten maken door JoyCaption.
Alleen bij foto’s die vanaf nu op een of andere manier zijn opgevallen bij wedstrijden of anderszins, zal ik de beschrijving gaan toevoegen.
Te beginnen met de foto’s die waren ingeschreven voor de wedstrijd Purple Theory op de website van ViewBug waar vandaag de uitslag van binnenkwam.
Wellicht dat ik dat ook ga doen bij alle foto’s uit mogelijke nieuwe fotoshoots.

Eerder dit jaar had ik al een blogbericht geschreven over het gebruik maken van Artificial Intelligence bij het genereren van afbeeldingen/foto’s.
Deze afbeeldingen zijn snel terug te vinden via deze link.

Kunstmatige Intelligentie is zeker niet iets van de laatste tijd.
Wetenschappers zijn al zeker van het begin van dit millennium bezig met het ontwikkelen van wiskundige modellen om de computer dingen te laten genereren op een snellere manier dan mensen dat zouden kunnen.
De modellen worden getraind met data, héél véél data.
Met al deze data kan Artificial Intelligence nieuwe dingen genereren en ik noem bewust “dingen”, want AI is toepasbaar in veel segmenten.

Wat wel van de laatste tijd (lees: 2 tot 3 jaar) is, is het genereren van afbeeldingen, muziek en video.
Meest bekende voorbeeld is ChatGPT die een ware revolutie op gang bracht omdat dit Open Source is.

Wanneer je ChatGPT vraagt om uit te leggen wat Open Source is, dan antwoordt hij met:
Open source verwijst naar software waarvan de broncode openbaar beschikbaar is. Dit betekent dat iedereen de code kan bekijken, gebruiken, aanpassen en verspreiden. Dit staat in contrast met proprietary software (eigen software), waarbij de broncode geheim wordt gehouden en alleen de gecompileerde versie (de applicatie) beschikbaar is voor de gebruiker.

De belangrijkste kenmerken van open-source software zijn:

  1. Vrijheid om te gebruiken: Iedereen mag de software voor elk doel gebruiken, of het nu persoonlijk, educatief of commercieel is.
  2. Toegang tot de broncode: De broncode is publiek beschikbaar, wat betekent dat iedereen kan inspecteren hoe de software werkt, bugs kan vinden of ervan kan leren.
  3. Mogelijkheid om aan te passen: Gebruikers kunnen de broncode aanpassen om de software aan hun eigen behoeften aan te passen. Dit kan het oplossen van bugs, het toevoegen van nieuwe functies of het verbeteren van de software voor specifieke toepassingen omvatten.
  4. Verspreiding: Gebruikers kunnen de software delen, zowel in de originele vorm als in een gewijzigde versie, vaak onder een licentie die ervoor zorgt dat anderen de software ook kunnen gebruiken en aanpassen.
  5. Community-samenwerking: Open-source projecten worden vaak ontwikkeld en onderhouden door een gemeenschap van vrijwilligers, organisaties of bedrijven, die samenwerken aan het verbeteren van de software.

Enkele bekende voorbeelden van open-source software zijn:

  • Linux (een besturingssysteem)
  • Apache HTTP Server (webserversoftware)
  • Firefox (webbrowser)
  • LibreOffice (kantoorsuite)
  • WordPress (contentmanagementsysteem)

Open-source software wordt vaak gelicenseerd onder specifieke open-source licenties, zoals de GNU General Public License (GPL), de MIT-licentie of de Apache-licentie, die bepalen hoe de software gebruikt, aangepast en verspreid mag worden.

Het open-source model bevordert transparantie, samenwerking en innovatie. Het is tegenwoordig een belangrijke basis voor veel moderne softwareontwikkeling.

Een goede Nederlandse vertaling van “Open Source” is “Open bron” of “Open source” (met de Engelse term in het Nederlands gebruikt). De term “open bron” verwijst letterlijk naar het feit dat de broncode van de software openbaar beschikbaar is.

ChatGPT, en zeker de eerste versie ervan, maakt gebruik van een Large Language Model (LLM), waarbij de output tekst is.
Inmiddels kan ChatGPT veel meer en zijn er ook andere “ChatGPT”’s op de markt verschenen, zoals Perplexity AIClaude AI en Copilot.

Het voordeel van Open Source is dat veel apps ook op de eigen, lokale computer geïnstalleerd en gebruikt kunnen worden.

Het voordeel van Open Source is dat veel apps ook op de eigen, lokale computer geïnstalleerd en gebruikt kunnen worden.

Met de vervanging van mijn inmiddels 11 jaar (!) oude computer door een op de groei gekochte nieuwe computer, komen al deze mogelijkheden van AI tot mijn beschikking.

Voor de beschrijving van een foto gebruik ik, zoals al eerder genoemd, JoyCaption die lokaal op mijn computer draait.
En voor de afbeelding die bovenaan dit blogbericht staat, is gebruik gemaakt van een app die met het model Flux deze afbeelding heeft gegenereerd.

Voor foto’s waarbij al gebruik is gemaakt van JoyCaption, volg deze link.