= Haskell: Introducere =

* Responsabil: [[nedelcu_vlad@yahoo.com|Vlad Nedelcu]]
* Data publicării: 25.03.2020
* Data ultimei modificări: 10.04.2020

== Obiective ==

Scopul acestui laborator este acomodarea cu primele noțiuni din Haskell și observarea incipientă a diferențelor dintre acesta și Racket.

Aspectele urmărite sunt:
* diferențele principale dintre cele 2 limbaje
* definirea funcțiilor în Haskell
* pattern matching
* list comprehensions
* tipuri
* gărzi

== Introducere ==

În jurul anilor 1990 un comitet de cercetători în limbaje de programare (Simon Marlow, Simon Peyton Jones, Philip Wadler etc) au creat un limbaj nou care a ajuns să fie standardul de-facto în cercetarea din domeniul programării funcționale. Inspirat dintr-o varietate de limbaje -- Miranda, ML, Scheme, APL, FP -- limbajul a influențat la rândul lui majoritatea limbajelor de programare cunoscute.

**Haskell** este un limbaj funcțional **pur**. Spre deosebire de limbajele imperative (sau Racket unde există ''set!''), în Haskell aproape toate funcțiile sunt pure. Funcțiile impure sunt marcate diferit prin intermediul sistemului de tipuri.

În plus față de Racket, Haskell are **tipare statica** (și tipuri **polimorfice**). Fiecare expresie are un tip și este sarcina programatorului să efectueze conversiile necesare între tipuri dacă este necesar. De cele mai multe ori, informația despre ce face o funcție se găsește integral în tipul acesteia și numele ei. Astfel, se pune accentul pe //ce// face funcția, nu //cum// efectuează ea operațiile cerute.

Deși tipurile există, programatorul nu este obligat să depună efort în a le scrie în program. Haskell deține inferență de tipuri puternică. Exceptând cazurile în care se folosesc concepte avansate, programatorul poate lucra fără a scrie o singură semnătură de funcție (deși nu e recomandat pentru că se pierde o parte din documentația funcției).

În plus, tipurile ajută programatorul în procesul de scriere a codului transformându-l într-un exercițiu de rezolvare a unui puzzle: pur si simplu trebuiesc potrivite tipurile folosind funcții existente sau scriind alte funcții. Pentru a căuta funcțiile ce respectă o semnătură se poate folosi [[http://www.haskell.org/hoogle/|Hoogle]], un motor de căutare similar Google dar doar pentru funcții Haskell.

Deosebirea fundamentală față de alte limbaje este **evaluarea leneșă**. Funcțiile nu vor fi evaluate și expresiile nu vor fi reduse până în momentul în care valoarea lor este necesară. Programatorul poate astfel lucra cu date infinite, extrăgând din ele strictul necesar pentru a obține soluția. Ca dezavantaj, analiza performanței unui cod Haskell este puțin mai dificilă, dar există instrumente auxiliare (dezvoltate în Haskell).


În cele ce urmează vom parcurge fiecare dintre aceste particularități, accentuând diferențele față de Racket. Pe scurt, o **paralela** între cele două limbaje arată în felul urmator:

^  Limbaj       ^  Evaluare    ^  Tipare    ^  Efecte laterale  ^
|  **Racket**   |  Aplicativă  |  Dinamică  |  Da               |
|  **Haskell**  |  Leneșă     |  Statică   |  Nu               |

Laboratoarele de Haskell din cadrul cursului se vor axa pe evidențierea acestor diferențe și a beneficiilor care rezultă din ele. Pentru noțiuni avansate despre limbaj, consultați primele 2 resurse din [[#referințe|bibliografie]] (sau Reddit, Stack Overflow, Planet Haskell, etc.)

Un exemplu pentru diferența de evaluare dintre Racket și Haskell:
<code scheme>
(define (square x) (* x x))
</code>

<code haskell>
square x = x * x
</code>

Evaluarea aplicativă din Racket va forța evaluarea parametrului x și apoi va apela funcția square:
<code>
(square (+ 1 2))
(square 3)
(* 3 3)
9
</code>

Evaluarea leneșă din Haskell va evaluarea parametrul x la cerere în cadrul apelului funcției square:
<code>
square (1 + 2)
(1 + 2) * (1 + 2)
3 * (1 + 2)
3 * 3
9
</code>
== GHC. GHCi ==

Există o varietate de compilatoare și interpretoare pentru Haskell. În momentul de față, limbajul și evoluția lui sunt strâns legate de eforturile dezvoltatorilor de la Glasgow. GHC, //The Glorious Glasgow Haskell Compilation System//, este și compilatorul pe care-l vom folosi pentru cursul de PP.

Pentru a avea o experiență bună cu acest limbaj, recomandarea este să vă instalați [[https://docs.haskellstack.org/en/stable/install_and_upgrade/|Haskell Stack]] (cititi instructiunile de aici: [[19:limbaje|Limbaje]]). Față de compilator și suita minimală de pachete, Haskell Stack aduce în plus o suită de biblioteci utile pentru dezvoltarea unor aplicații reale.

Codul Haskell poate fi atât compilat cât și interpretat. Pentru interpretare vom folosi **ghci**, iar pentru compilare vom folosi **ghc**. Fișierele de cod Haskell au în mod normal extensia ''.hs'', dar se poate folosi și ''.lhs'' pentru variantele de **Literate Haskell** (programare ca o poveste - comentariile ocupă majoritatea textului în timp ce secvențele de cod sunt puține - este formatul preferat pentru publicarea de articole despre Haskell pe bloguri, oricine poate copia textul articolului într-un fișier și îl poate compila și rula apoi).

În cadrul laboratorului, recomandăm folosirea **ghci** în modul următor:

* se salvează definițiile de funcții într-un fișiere cu extensia ''.hs'' (ex.: lab6-ex.hs)
* se deschide consola sistemului (ex.: cmd/powershell pe Win) in directorul cu fisierul ''.hs''
* se rulează ''stack exec ghci nume.hs'' pentru a-l încărca în interpretor
* se rulează în interpretor apelurile de funcții de test necesare, verificarea de tipuri, etc
* dacă se dorește **editarea fișierului** se poate face într-un terminal separat (recomandat) sau folosind '':e'' ('':edit'') din ''ghci''
* ATENTIE! după editarea fișierului, pentru a reîncărca definițiile se folosește '':re'' ('':reload'')
* dacă se dorește încărcarea altor module în interpretor (pentru testare), se poate folosi '':m +Nume.Modul''
* pentru a verifica tipul unor expresii se folosește '':t expresie''
* pentru a ieși din interpretor se folosește '':q'' (sau EOF - ''^Z'' pe Linux/OSX, ''^D'' pe Windows)

Modulul ''Prelude'' conține funcții des folosite și este inclus implicit în orice fișier (deși poate fi exclus la nevoie, consultați [[#referințe|bibliografia]]).

În cadrul unor programe reale va trebui să compilați sursele. Pentru aceasta va trebui să aveți un modul ''Main.hs'' care să conțină o funcție ''main''. Modulul poate importa alte module prin ''import Nume.Modul''.
Pentru temă, nu va trebui să efectuați acești pași, scheletul de cod ce va fi oferit va conține partea de interacțiune cu mediul exterior. =)

== Comentarii ==

În Haskell, avem comentarii pe un singur rând, folosind ''%%--%%'' (2 de ''-'' legați) sau comentarii pe mai multe rânduri, încadrate de ''{-'' și ''-}''. În plus, există comentarii pentru realizarea de documentație dar nu vom insista pe ele aici.

== Functii ==

O funcție anonimă în **Racket**

<code scheme>
(lambda (x y) (+ x y))
</code>

poate fi tradusă imediat în Haskell utilizând tot o //abstracție lambda//

<code haskell>
\x y -> x + y
</code> 

Sintaxa Haskell este ceva mai apropriată de cea a **calculului Lambda**: ''\'' anunță parametrii (separați prin spații), iar ''->'' precizează corpul funcției.

În Racket, puteam da nume funcției folosind legarea dinamică prin intermediul lui ''define'' sau legarea statică prin intermediul lui ''let''. Exemplele următoare ilustrează cele 2 cazuri, împreună cu apelul funcției.

<code scheme>
(define f (lambda (x y) (+ x y)))
(f 2 3)
</code>

<code scheme>
(let ((f (lambda (x y) (+ x y)))) (f 2 3))
</code>

În Haskell, funcția echivalentă ar fi

<code haskell>
f = \x y -> x + y
</code> 

sau	 
		 
<code haskell>	 
f x y = x + y
</code>

Și apelul

<code haskell>
f 2 3
</code>

Observați că se renunță la paranteze. Unul dintre principiile dezvoltării limbajului a fost oferirea de construcții cât mai simple pentru lucrurile folosite cel mai des. Fiind vorba de programarea funcțională, aplicarea de funcții trebuia făcută cât mai simplu posibil.

Tot din același considerent, operatorii în Haskell sunt scriși în forma **infixată**. Restul apelurilor de funcții sunt în forma prefixată, exact ca în Racket. Totuși, se pot folosi ambele forme: pentru a folosi un operator prefixat se folosesc paranteze, în timp ce pentru a infixa o funcție se folosesc //back-quotes// (''`'').

<code haskell>
2 + 3 == (+) 2 3
elem 2 [1,2,3] == 2 `elem` [1, 2, 3]
</code>

Tot pentru simplitate, Haskell permite folosirea unor secțiuni -- elemente de zăhărel sintactic care se vor traduce în funcții anonime:

<code haskell>
(2 +) == \x -> 2 + x
(+ 2) == \x -> x + 2
(- 2) == -2
(2 -) == \x -> 2 - x
</code>

**Atenție**: În construcția ''(- x)'' operatorul ''-'' este unar, nu binar (este echivalentul funcției ''negate'').
== Tipuri de bază ==

În această secțiune vom prezenta tipurile existente în limbajul Haskell. Veți observa că limbajul este mult mai bogat în tipuri decât Racket. Programatorul își va putea defini alte tipuri proprii dacă dorește.

Pentru a putea vedea tipul unei expresii în ''ghci'' folosiți '':t expresie''.

<code haskell>
> :t 'a'
'a' :: Char
</code>

Operatorul ''::'' separă o expresie de tipul acesteia.

<code haskell>
> :t (42::Int)
(42::Int) :: Int
</code>

=== Numere, caractere, siruri, booleeni ===

Urmatorii literali sunt valizi in **Haskell** (dupa operatorul ''::'' sunt precizate tipurile acestora):

<code haskell>
5       :: Int
'H'     :: Char
"Hello" :: String -- sau [Char] -- lista de Char
True    :: Bool
False   :: Bool
</code>

Observați că există tipul caracter și tipul șir de caractere. Tipul ''String'' este de fapt un sinonim pentru tipul ''[Char]'' - tipul listă de caractere. Astfel, operațiile pe [[#liste|liste]] vor funcționa și pe șiruri.

Tipurile numerice sunt puțin diferite față de alte limbaje de programare cunoscute:

<code haskell>
> :t 42
42 :: Num a => a
</code>

În exemplul de mai sus, ''a'' este o variabilă de tip (stă pentru orice fel de tip) restricționată (prin folosirea ''=>'') la toate tipurile numerice (''Num a'').

Important de reținut este faptul că există **2** tipuri întregi: ''Int'' și ''Integer''. Primul este finit, determinat de arhitectură, în timp ce al doilea este infinit, putând ajunge oricât de mare.

=== Liste ===

O listă în Haskell se construiește similar ca în Racket, prin intermediul celor doi constructori:

<code haskell>
[] -- lista vidă
(:) -- operatorul de adăugare la începutul listei - cons
</code>

Pentru simplitate, o construcție de forma

<code haskell>
1:3:5:[]
</code>

se poate scrie și

<code haskell>
[1, 3, 5]
</code>

sau

<code haskell>
[1, 3 .. 6]
</code>

sau

<code haskell>
[1, 3 .. 5]
</code>

Echivalente pentru ''car'' și ''cdr'' din Racket sunt funcțiile ''head'' și ''tail'':

<code haskell>
> head [1, 2, 3]
1
> tail [1, 2, 3]
[2, 3]
</code>

Operatorul de **concatenare** este ''++'':

<code haskell>
> [1, 2, 3] ++ [4, 5]
[1, 2, 3, 4, 5]
</code>

Haskell oferă un mod suplimentar de a genera liste: scriem proprietățile pe  care ar trebui să le respecte elementele listei într-o sintaxă numită **list comprehension**. Este o sintaxă similară celei din matematică. De exemplu, vrem lista numerelor pare, divizibile cu 3. În matematică, am fi avut ceva de tipul ''{x | x ∈ N2, x ≡ 0 (mod 3)}'' (pentru ''N2'' mulțimea numerelor pare). În Haskell, avem

<code haskell>
> [x | x <- [0, 2 ..], x `mod` 3 == 0] -- lista numerelor naturale pare, divizibile cu 3
[0,6,12,18,24,30,36,42,48,54,60,66,72,78,84,90,96,102,108, Interrupted.
</code>

Observați că se generează elemente la infinit. Pentru fiecare element din lista ''[0, 2 ..]'' (din expresia ''x <- [0, 2..]'') se testează condițiile următoare. Dacă toate sunt îndeplinite, se generează elementul din fața ''|''.

Pentru a putea vedea o porțiune a fluxului folosim functiile ''take'' și ''drop''.

=== Perechi ===

În Haskell, elementele unei liste **sunt de același tip**. Dacă dorim construcții cu elemente de tipuri diferite vom folosi tuplurile

<code haskell>
(3, "Ana") :: (Int, String)
(3, True, "Ana") :: (Int, Bool, String)
</code>

Haskell oferă funcții pentru extragerea componentelor din perechi

<code haskell>
> fst (3, "Ana")
3
> snd (3, "Ana")
"Ana"
</code>

Se ofera de asemenea și funcțiile ''zip'' și ''unzip'', **doar** pentru perechi, dar există și ''zip3'' și ''unzip3'' pentru triplete.

Pentru tuplurile cu mai mult de 2 elemente este sarcina programatorului să definească funcțiile folosite.

== Definirea funcțiilor ==

Să considerăm că vrem să scriem o funcție pentru factorialul unui număr. Prima implementare ar folosi sintaxa ''if'':

<code haskell>
factorial_if x = if x < 1 then 1 else x * factorial_if (x - 1)
</code>

Este obligatoriu ca ''if'' să conțină **ambele** ramuri și ca acestea să fie **de același tip**.

Mai frumos, putem scrie funcția de mai sus folosind gărzi:

<code haskell>
factorial_guards x
  | x < 1 = 1
  | otherwise = x * factorial_guards (x - 1)
</code>

Observați indentarea: orice linie care face parte din aceeași expresie ca cea de deasupra trebuie să înceapă la exact aceeași indentare. Orice linie care este o subexpresie a expresiei de mai sus (''then'' sau ''else'' în cazul ''if'', fiecare gardă în parte, etc.) trebuie să fie indentată mai spre dreapta.

Construcția ''otherwise'' este echivalentă expresiei ''True''. O gardă poate conține orice fel de expresie care se va evalua la o valoarea de tip ''Bool''.

Fiecare gardă este testată în ordine, prima adevărată este executată.

Pentru a ne apropia de definiția matematică, putem scrie aceeași funcție folosind ''case'' (echivalentul ''switch''-ului din C dar mult mai avansat):

<code haskell>
factorial_case x = case x < 1 of
  True -> 1
  _ -> x * factorial_case (x - 1)
</code>

Observați regula indentării aplicată și aici. Expresia ''_'' semnifică orice valoare, indiferent de valoarea ei. Expresia din ''case'' poate fi oricare.

Fiecare caz este tratat în ordine, prima potrivire este executată.

În final, putem scrie aceeași funcție folosind **pattern matching**:

<code haskell>
factorial_pm 0 = 1
factorial_pm x = x * factorial_pm (x - 1)
</code>

Expresiile din interiorul fiecărei ramuri din ''case'' sau din interiorul pattern-match nu pot fi decât constructorii unui tip (similar cu ce ați făcut la AA). În continuare vom folosi cele 4 stiluri pentru a ilustra funcția care calculează lungimea unei liste

<code haskell>
length_if l = if l /= [] then 1 + length_if (tail l) else 0
</code>
<code haskell>
length_guard l
  | l /= [] = 1 + length_guard (tail l)
  | otherwise = 0
</code>
<code haskell>
length_case l = case l of
   (_ : xs) -> 1 + length_case xs
   _ -> 0
</code>
<code haskell>
length_pm [] = 0
length_pm (_:xs) = 1 + length_pm xs
</code>

Observați în exemplele de mai sus expresivitatea limbajului. Folosirea construcției potrivite duce la definiții scurte și ușor de înțeles.

== Curry vs Uncurry ==

Fiind un limbaj funcțional, în Haskell funcțiile sunt valori de prim rang. Astfel, putem afla tipul unei funcții:

<code haskell>
f x y = x + y
</code>

<code haskell>
> :t f
f :: Num a => a -> a -> a
</code>

Fiecare argument este separat prin ''->'' de următorul sau de rezultat.

Amintindu-ne de discuția despre [[../racket/functionale#functii-curryuncurry|funcții curry și uncurry]], rezultatul următor nu trebuie să ne surprindă

<code haskell>
> :t f 3
f 3 :: Num a => a -> a
</code>

Toate funcțiile din Haskell sunt în formă **curry**.

Pentru a face o funcție uncurry putem folosi funcția ''uncurry :: (a -> b -> c) -> (a, b) -> c'' dacă vrem să transformăm o funcție echivalentă sau putem s-o definim în mod direct folosind perechi.

== Funcționale uzuale ==

Haskell oferă un set de funcționale (similar celui din Racket) pentru cazuri de folosire des întâlnite (dacă nu mai știți ce fac, încercați să ghiciți citind semnătura și numele ca o documentație):

<code haskell>
> :t map
map :: (a -> b) -> [a] -> [b]
> :t filter
filter :: (a -> Bool) -> [a] -> [a]
> :t foldl
foldl :: (a -> b -> a) -> a -> [b] -> a
> :t foldr
foldr :: (a -> b -> b) -> b -> [a] -> b
> :t zip
zip :: [a] -> [b] -> [(a, b)]
</code>

Folosirea lor duce la un cod mai ușor de citit și de întreținut.

== Point-free programming ==

În Haskell, compunerea funcțiilor se realizează cu ajutorul operatorului ''.''. De interes este și operatorul ''$'' definit ca:

<code haskel>
f $ x = f x
</code>

El are avantajul de a grupa expresiile din dreapta și stânga lui înainte de aplicarea funcției, scăpând astfel de paranteze:

<code haskell>
length $ 3 : [1, 2] -- length (3 : [1, 2])
</code>

Împreună cu ''curry'', ''uncurry'' și ''flip'' aceste funcții duc la un stil de programare în care valoarea în care se evaluează funcția nu este prezentă. Urmăriți exemplul următor de transformare

<code haskell>
square x = x*x
inc x = x+1
f1 x = inc (square x)
f2 x = inc $ square x
f3 x = inc . square $ x
f4 = inc . square
</code>

Stilul are câteva avantaje în domeniul expresivității și al verificării programului dar poate duce ușor la cod obfuscat.

== Resurse ==

* {{ :20:laboratoare:haskell:intro-ex.zip | Exerciții}}
* {{ :20:laboratoare:haskell:haskell-cheatsheet-1.pdf | Cheatsheet}}
* {{ :20:laboratoare:haskell:intro-sol.zip | Soluții}}
== Referințe ==


* //[[http://learnyouahaskell.com/chapters|Learn You a Haskell]]//, este utilă pentru toate laboratoarele de Haskell plus ceva extra
* //[[http://www.haskell.org/hoogle/|Hoogle]]//, search for Haskell functions starting from types
* //[[http://hackage.haskell.org/packages/hackage.html|Hackage]]//, repository pentru pachete Haskell
* //[[http://www.haskell.org/haskellwiki/Pointfree|Pointfree on Haskell Wiki]]//
* //[[http://buffered.io/posts/point-free-style-what-is-it-good-for|Pointfree Style - Whay is it good for]]//
* //[[http://lambda-the-ultimate.org/node/3233|Advantages of point-free on Lambda the Ultimate]]//