Unelte utilizator

Unelte site


laboratoare:laborator-02

Diferențe

Aici sunt prezentate diferențele dintre versiunile selectate și versiunea curentă a paginii.

Link către această vizualizare comparativă

Ambele părți revizuirea anterioară Versiuni anterioare
Urmatoarea versiune
Versiuni anterioare
laboratoare:laborator-02 [2017/03/02 20:48]
iulian.matesica
laboratoare:laborator-02 [2018/02/25 22:02]
mihai.iacov [2.2 Caracterizarea unui algoritm]
Linia 1: Linia 1:
-====== Laborator 02: Liste ====== +====== Laborator 02: Algoritmi de sortare 1 ======
-\\ +
-=====1 Obiectivele laboratorului===== +
-*Înțelegerea conceptului de funcționare și implementarea unor liste dublu înlănțuite și circulare +
-*Implementarea unor funcții individuale de lucru cu aceste structuri de date. +
-\\+
  
-=====2 Ce este o listă?===== +=====1. Obiectivele laboratorului=====
-====2.1 Definiție==== +
-Listele sunt cele mai bune și cele mai simple exemple a unei structuri de date dinamice care folosește pointeri +
-la implementarea sa.în mod esențial, trebuie înțeles că listele funcționează ca un vector care se poate mări sau +
-micșora după nevoie, din orice punct al mulțimii sale de elemente.+
  
-{{ :laboratoare:array_vs_list.png?400 |}}+Propunem studierea următorilor algoritmi de sortare: 
 + * Bubble Sort 
 + * Selection Sort 
 + * Insertion Sort 
 + * Merge Sort 
 + * Quick Sort
  
-Avantaje ale utilizării listelor: +=====2. Introducere=====
-*Elementele pot fi adăugate sau șterse din mijlocul listei +
-*Nu trebuie definită o mărime inițială, iar memoria se alocă pe rând, odată cu fiecare element adăugat+
  
-Definirea nodului unei liste: +==== 2.1 Calculul complexităţii algoritmilor ====
-<file cpp> +
-typedef struct { +
-     int val; +
-     node *next; +
-} node_t; +
-</file>+
  
-====2.2 Clasificare==== +Analiza complexității unui algoritm are ca scop estimarea volumului de resurse de calcul necesare pentru execuția algoritmuluiPrin resurse se înțelege:\\ 
-* **Liste simplu înlănțuite** - Elementele au o singură legătură către următorul element introdus, iar ultimul +• //Spațiul de memorie// necesar pentru stocarea datelor pe care le prelucrează algoritmul.\\ 
-element pointează către NULL.+• //Timpul necesar pentru execuția// tuturor prelucrărilor specificate în algoritm
  
-{{ :laboratoare:simplelist.png?500 | Liste simplu înlănțuite}}+Această analiză este utilă pentru a stabili dacă un algoritm utilizează un volum acceptabil de resurse pentru rezolvarea unei probleme. In acest fel timpul de executie va fi exprimat prin numarul de operatii elementare executate. Sunt considerate operatii elementare cele aritmetice (adunare, scadere, ınmulțire, ımpartire), comparatiile si cele logice (negatie, conjuncte și disjunctie).
  
 +Este așadar suficient sa se contorizeze doar anumite tipuri de operații elementare,  numite //operații de bază//. Timpul de executie  al ıntregului algoritm se obtine ınsumand timpii de executie ai prelucrarilor componente.
  
-* **Liste dublu înlănțuite** - Elementele au dublă legătură către precedentul și antecedentulcapul listei pointând +**Exemplul 1 - Suma a numere** \\ 
-spre NULL și ultimul element de asemenea+Consideram problema calculului sumei .  Dimensiunea acestei probleme poate fi considerata //n//  Algoritmul si tabelul cu costurile corespunzatoare prelucrărilor sunt prezentate ın Tabel. Insumand timpii de executie ai prelucrarilor elementare se obtine: T(n)=n(c<sub>3</sub> + c<sub>4</sub> + c<sub>5</sub>) + c<sub>1</sub> + c<sub>2</sub> + c<sub>3</sub> deci T(n)=k<sub>1</sub>n + k<sub>2</sub>adica timpul de executie depinde liniar de dimensiunea 
 +problemei.  Costurile operatiilor elementare influenteaza doar constantele ce intervin ın functia T(n). 
 +{{ :laboratoare:complexitati1.png?600 |}}
  
-{{ :laboratoare:doublelist.jpg?500 |}} 
  
-* **Liste circulare** - Pot fi simplu sau dublu înlănțuite cu proprietatea că ultimul element pointează spre primul.+**Exemplul 2 - Înmulțirea a 2 matrici** \\ 
 +Consideram problema determinarii produsului a doua matrici: A de dimensiune m×n si B de dimensiune n×p. In acest caz dimensiunea problemei este determinata de trei valori: (m, n, p). \\ 
 +In practica nu este necesara o analiza atat de detaliata ci este suficient sa se identifice 
 +operatia dominantă si sa se estimeze numarul de repetari ale acesteia. Prin operatie dominanta se ıntelege operatia care contribuie cel mai mult la timpul de executie a algoritmului si de regulă este operatia ce apare ın ciclul cel mai interiorÎn exemplul  ar putea fi considerata ca operatie dominanta, operatia de ınmultire. In acest caz costul executiei algoritmului ar fi T(m, n, p)=mnp 
  
-{{ :laboratoare:circularlist.png?500 |#Poza lista circulare#}}+{{ :laboratoare:complexitati2.png?600 |}}
  
-====2.3 Operații cu liste:==== +----
-*Adăugare la începutul listei +
-*Adăugare la sfârsitul listei +
-*Adăugarea înainte sau după un element dat +
-*Ștergerea capului de listă +
-*Ștergerea unui element oarecare din listă+
  
 +====2.2 Caracterizarea unui algoritm====
  
-=====3.Exerciții propuse pentru laborator===== +Numim **sortare** orice aşezare(sau - mai clar - **reaşezare**) a unor elemente date în aşa fel încâtdupă aşezare, să existe o  **ordine completă** în funcţie de un atribut(numit **cheie**) al elementelor.
-1. Creați o listă circulară,dublu inlănțuită cu 6 angajați ai unei companiicare să conțină următoarele referințe: nume, nr de telefon, post. +
-  Scrieți funcțiile care să scrie urmatoarele:\\ +
-  Să introducă un nou angajat după al treilea.\\ +
-  Să introducă un nou angajat inainte de cel care e "mecanic".\\ +
-  Să steargă angajatul cu un anumit număr de telefon introdus.\\+
  
-2. Să se creeze listă liniara simplu inlantuita care contine elemente intregi citite dintr-ul fisier text. +Pentru a exista **ordine completă**, trebuie să alegem o **relaţie** pe care vrem sa impunemDacă relaţia este valabilă între **oricare două elemente** pentru care **primul** element **este** aşezat **la stânga** celui de-al doilea, atunci avem o **ordine completă**.
-Se citeste apoi valoare intreaga xSa se stearga primul nod care contine valoarea x. +
-Fișierul se va da ca parametru în linia de comandă.+
  
-3.Sa se construiasca o lista liniara simplu inlantuita cu elemente numere intregi. Să se afișeze șapoi să se stearga din lista elementele pare+Exemplu: dacă alegem drept cheie un atribut **număr întreg** şrelaţia **mai mic sau egal**(<=), obţinem **ordinea crescătoare**.
  
-=====4. Exercitii Liste ===== +Vom descrie un algoritm de sortare prin: 
-Pentru laboratorul de liste inlantuite vom porni de la o arhiva cu un schelet de laborator. Nu veti scrie codul de la zero ci veti implementa cateva functii in fisierul ''%%list.c%%''.+ *timp mediu - timpul de execuţie la care ne aşteptăm, **în medie**, pentru sortare 
 + *timp la limită- timpul de execuţie pentru **cel mai rău** caz posibil 
 + *memorie - memoria **maximă** de care are nevoie algoritmul pentru sortare(**excludem memoria deja alocată** înainte de algoritm -> vectorul efectiv ce va fi sortat) 
 + *stabilitate - un algoritm stabil păstrează ordinea în care apar două elemente cu aceeaşi cheie(atributul după care sortăm)
  
-Descarcati arhiva de aici si dezarhivati-o. Puteti folosi utilitarul ''%%wget%%' pentru descarcare si utilitarul ''%%unzip%%' pentru dezarhivare. +Folosim notaţia O(npentru a indica
-<code bash> + *un număr de operaţii de ordinul lui nÎn acest cazspunem că avem "**complexitate de timp de ordinul lui n**" 
-student@sda-ab-vm:~/Documents$ wget http://elf.cs.pub.ro/sda-ab/wiki/_media/laboratoare/lab1-skel.zip + *o dimensiune de ordinul lui n pentru memoria alocatăÎn acest caz, spunem că avem "**complexitate de spaţiu de ordinul lui n**"
---2017-03-02 20:45:55--  http://elf.cs.pub.ro/sda-ab/wiki/_media/laboratoare/lab1-skel.zip +
-Resolving elf.cs.pub.ro (elf.cs.pub.ro)... 141.85.227.116 +
-Connecting to elf.cs.pub.ro (elf.cs.pub.ro)|141.85.227.116|:80... connected. +
-HTTP request sent, awaiting response... 200 OK +
-Length: 2368 (2,3K) [application/zip] +
-Saving to: ‘lab1-skel.zip’+
  
-lab1-skel.zip       100%[===================>]   2,31K  --.-KB/s    in 0s      +<note important> 
 +În acest material se face abuz de notaţie. **NU** confundaţi cu notaţiile **Big-O (O)****Big-Omega (Ω)**, **Big-Theta (θ)**De fapt, notaţia din acest material "O(n)" se apropie ca semnificaţie de notaţia Big-Theta. 
 +</note>
  
-2017-03-02 20:45:56 (4,78 MB/s) - ‘lab1-skel.zip’ saved [2368/2368]+====2.3 Metodele de sortare folosite====
  
-student@sda-ab-vm:~/Documents$ ls +Fiecare algoritm se bazează pe o metodă de sortare
-lab1-skel.zip + *Bubble sort interschimbare 
-student@sda-ab-vm:~/Documents$ unzip lab1-skel.zip + *Selection sort selecţie 
-Archive:  lab1-skel.zip + *Insertion sort inserare 
-  inflating: list.c                   + *Merge sort interclasare 
-  inflating: list.h                   + *Quick sort partiţionare
-  inflating: Makefile +
-student@sda-ab-vm:~/Documents$ make +
-gcc list.c -o list -std=gnu99 +
-student@sda-ab-vm:~/Documents$ make run +
-</code>+
  
-Pentru compilare folositi comanda ''%%make%%''. Pentru rulare puteti folosi fie **''%%./list%%''** fie comanda ''%%make run%%''. 
  
 +=====3. Algoritmii=====
  
 +====3.1 Bubble sort====
  
 +  * timp mediu: O(N^2)
 +  * timp la limită: O(N^2)
 +  * memorie: O(1)
 +  * Stabil: DA
  
 +===Descriere :===
 +Sortarea prin metoda bulelor se consideră drept una din cele mai puţin efective metode de
 +sortare, dar cu un algoritm mai simplu.
  
-====Probleme opţionale - de interviu====+ *Ideea de bază a sortării prin metoda bulelor este în a parcurge tabloul, de la stânga spre dreapta, 
 +fiind comparate elementele alăturate **a[i] si a[i+1]**. Dacă vor fi găsite 2 elemente neordonate, 
 +valorile lor vor fi interschimbate. 
 + *Parcurgerea tabloului de la stânga spre dreapta se va repeta atât timp cât vor fi întâlnite 
 +elemente neordonate.
  
-1Se dă o listă simplu înlănţuită(primiţi doar un pointer către primul element). Verificaţi dacă lista conţine o buclă. (o listă simplu înlănţuită conţine o buclă => niciun element nu are legătura NULL)+{{ :laboratoare:bubble-sort-example-300px.gif?nolink |}}
  
-2. Se dau două liste(pentru fiecare listă pointer către primul elementîn formă de Y(listele se intersectează, ultimele k elemente sunt comune). Aflaţvaloarea lui k.+===Implementare :=== 
 +<file cpp> 
 +//sortare descrescatoare 
 +void bubble(int a[],int n) 
 +
 +    int i,schimbat,aux; 
 +    do { 
 +        schimbat = 0; 
 +        // parcurgem vectorul 
 +        for(i = 0; i < n-1; i++
 +     // daca valoarea i din vectorul a este mai mica decat cea de pe pozitia i+1 
 +            if (a[i] < a[i+1]{  
 +                // interschimbare 
 +         aux = a[i]; 
 + a[i] = a[i+1]; 
 + a[i+1] = aux; 
 + schimbat = 1; 
 +     } 
 +        } 
 +    } while(schimbat); 
 +
 +</file>
  
-3. Se dă o listă  cu 2n+1 elemente, fiecare element conţine câte un întreg. Toate valorile întregi apar de două ori în listă, excepţie facând una singură. Aflaţi acea valoare.+====3.2 Selection sort====
  
-====== ExtraHashtable(tabela de dispersie)======+  * timp mediuO(N^2) 
 +  * timp la limită: O(N^2) 
 +  * memorie: O(1) 
 +  * Stabil: DA
  
-=====1 Introducere=====+===Descriere :=== 
 +Acest algoritm selectează, la fiecare pas i, cel mai mic element din vectorul nesortat(de la poziţia 
 +i până la n).Valoarea minimă găsită la pasul i este pusă în vector la poziţia i,facându-se 
 +intereschimbarea cu poziţia actuală a minimului.Nu este un algoritm indicat pentru vectorii 
 +mari, în majoritatea cazurilor oferind rezultate mai slabe decât **insertion sort** şi **bubble sort**. 
 +{{ :laboratoare:selection-sort.gif?nolink |}}
  
-(De urmărit ideea din introducere şfuncţia de indexare)+===Implementare :=== 
 +<file cpp> 
 +void selectionSort(int a[],int n) 
 +
 + int i,j,aux,min,minPoz; 
 + for(i = 0; i < n - 1;i++) 
 +
 + minPoz = i; 
 + min = a[i]; 
 + for(j = i + 1;j < n;j++) //selectam minimul 
 + //din vectorul ramas( de la i+1 la n) 
 +
 + if(min > a[j]) //sortare crescatoare 
 +
 + minPoz = j; //pozitia elementului minim 
 + min = a[j]; 
 +
 +
 + aux = a[i] ; 
 + a[i] = a[minPoz]; //interschimbare 
 + a[minPoz] = aux; 
 +
 +
 +</file>
  
-====1.1 Poveste====+====3.3 Insertion sort====
  
-===Să presupunem urmatoarele detalii dintr-un caz real:===+  * timp mediu: O(N^2) 
 +  * timp la limită: O(N^2) 
 +  * memorie: O(1) 
 +  * Stabil: DA
  
- **Situaţia**: -Într-o bibliotecă sunt foarte multe cărţi şi, deşi spaţiul nu reprezintă o problemă, angajaţii nu dispun de suficient timp pentru a ordona toate cărţile după titlu(în ordine alfabetică).+===Descriere :=== 
 +Spre deosebire de alţi algoritmi de sortare, sortarea prin inserţie este folosită destul de des 
 +pentru sortarea tablourilor cu **număr mic de elemente**. De exemplu, poate fi folosit pentru a 
 +îmbunătăţi rutina de sortare rapidă. 
 + *Sortarea prin inserţie seamană oarecum cu sortarea prin selecţie. Tabloul este împărţit 
 +imaginar în două părţi - o parte sortată şi o parte nesortată. La începutpartea sortată conţine 
 +primul element al tabloului şi partea nesortată conţine restul tabloului.  
 + *La fiecare pas, algoritmul ia primul element din partea nesortată şi il inserează în locul potrivit al părţii sortate. 
 + *Când partea nesortată nu mai are nici un element, algoritmul se opreste.
  
- **Problema**: -Ei vor să găsească o metodă de a pune cărţile pe rafturi în aşa fel incat să nu fie nevoie să caute prin toată biblioteca atunci când cineva are nevoie de o carte, dar să dureze mai puţin timp să le pună pe rafturi decât dacă le-ar ordona.+{{ :laboratoare:insertion-sort-example-300px.gif?nolink |}}
  
- **Soluţia generală**-Ei împart spaţiul în mai multe **sectoare**(un sector fiind reprezentat de unul sau de mai multe rafturişdecid să pună cărţile care “**seamană**” între ele în acelaşsector.+===Implementare :=== 
 +<file cpp> 
 +void insertionSort(int a[], int n) 
 +
 +    int i, j, aux; 
 +    for (i = 1; i < n; i++) 
 +    { 
 +        j = i; 
 +        while (j > 0 && a[j - 1] > a[j]) 
 +        { //cautam pozitia pe care sa mutam a[i
 +            aux = a[j]; //interschimbare 
 +            a[j] = a[j - 1]; 
 +            a[--j] = aux; 
 +        } 
 +    } 
 +
 +</file>
  
- **O soluţie**: -Ei consideră că două carţi “seamană” între ele dacă titlurile lor încep cu aceeaşi literă, aşa că au nevoie de câte un sector pentru fiecare literă cu care ar putea începe titlul unei cărţi. Folosind această regulă, angajaţii nu au nevoie de mai mult de 32 de sectoare(26 pentru engleză), adică de atâtea sectoare câte litere sunt în alfabet, deci fiecarui sector îi va corespunde o literă.+====3.4 Merge sort====
  
- **Rezultatele**:  +  * timp mediu: O(N log N) 
-  *O carte poate fi pusă într-un raft imediat după ce identificăm ce sector are aceeaşi literă cu prima literă din titlul cărţii, putem lua această decizie fără a ţine cont de celelalte cărţi, deci vom avea nevoie de mai puţin timp. +  timp la limităO(N log N) 
-  *Când cineva vrea să găsească o carte din bibliotecă, este suficient să caute într-un sector, nu este necesar să caute în toată biblioteca.+  * memorie: O(N) 
 +  * Stabil: DA
  
- **Limitări**-Soluţia propusă funcţionează cel mai bine atunci când sectoarele deţin(fiecare) acelaşi număr de cărţiCe se întâmplă atunci când un sector este mult mai mare decât celelalte? (Multe titluri încep cu “The” în engleză)+===Descriere :=== 
 +În cazul sortării prin interclasare, vectorii care se interclasează sunt două secvenţe ordonate 
 +din acelaşi vector. 
 +Sortarea prin interclasare utilizează metoda **Divide et Impera**:
  
- **Concluzie**: -Trebuie să **alegem cu grijă** regula după care spunem că două cărţi “**seamănă**” între eleO regulă simplă ne face treaba mai uşoară la aşezaredar mai grea la căutareO regulă complicată face pe dos: mai greu la aşezaredar mai uşor la căutare.+ *se împarte vectorul în secvenţe din ce în ce mai mici, astfel încât fiecare secvenţă să fie 
 +ordonată la un moment dat şi interclasată cu o altă secvenţă din vector corespunzătoare. 
 + *practic, interclasarea va începe când se ajunge la o secvenţă formată din două elementeAceasta, odată ordonată, se va interclasa cu o alta corespunzătoare(cu 2 elemente)Cele două secvenţe vor alcătui un subşir ordonat din vector mai mare(cu 4 elemente) care, la rândul luise va interclasa cu un subşir corespunzător(cu 4 elemente) ş.a.m.d.
  
-===Folosind o abordare mai tehnică, să urmărim aceleaşi detalii:===+{{ :laboratoare:merge-sort-example-300px.gif?nolink |}}
  
- **Situaţia**:  -se dă un **vector**(sau o **listă**) cu foarte multe intrări şi, deşi spaţiul(**memoria**) nu reprezintă o problemă, nu dispunem de suficient **timp** încât să efectuăm o sortare completă(alfabetică, dupa nişte titluri şiruri de caractere).+====3.5 Quick sort====
  
- **Problema**-căutăm o “semi-sortare” a intrărilor care să fie cât mai rapidă şi care să aducă un avantaj(faţă de păstrarea într-o ordine întâmplătoareatunci când vrem să accesăm anumite intrări.+  * timp mediu: O(N log N) 
 +  timp la limită: O(N^2) 
 +  memorieO(log N) 
 +  * Stabil: NU
  
- **Soluţia generală**: -împarţim spaţiul în mai multe sectoare(un sector fiind reprezentat de un vector sau de o listă), punem intrările care “seamană” între ele în acelaşi sector.+===Descriere :=== 
 +Quick Sort este unul dintre cei mai rapizi şi mai utilizaţi algoritmi de sortare până în acest moment,bazându-se pe tehnica "**Divide et impera**".Deşi cazul cel mai nefavorabil este O(N^2), în practică, QuickSort oferă rezultate mai bune decât restul algoritmilor de sortare din clasa "O(N log N)".
  
- **O soluţie**: -alegem ca un sector să reprezinte o literă şi aceea să fie litera cu care încep toate titlurile intrărilor din acel sector. În realitatesectoarele pot fi notate cu litere, dar, într-un limbaj de programare, le notăm cu numere pentru lucra mai uşor.+Algoritmul se bazează pe următorii paşi: 
 + *alegerea unui element pe post de **pivot*
 + *parcurgerea vectorului din două părţi(de la stânga la pivot, de la dreapta la pivot, ambele în acelaşi timp) 
 + *interschimbarea elementelor care se află pe "**partea greşită**" a pivotului(mutăm la dreapta pivotului elementele mai marila stânga pivotului elementel mai mici) 
 + *divizarea algoritmului: după ce mutăm elementele pe "**partea corectă**" pivotului, avem **2 subşiruri de sortat**, iar pivotul se află pe poziţia bună.
  
-   * Functia index dă valorile **{0,1,2,…}** pentru titluri care încep cu literele **{‘A’,’B’,’C’,…}**. Această funcţie se foloseşte de codul ASCII, deci ne limităm la alfabetul limbii engleze. +<note>Nu există restricţii pentru alegerea pivotuluiAlgoritmul prezentat alege mereu elementul din mijloc</note>
- <file cpp> +
-   unsigned int index(char[] titlu) { return (titlu[0] - ‘A’); } +
-  </file> +
-  +
-  *  Ignorând problema spaţiului, definim secvenţa pentru distribuirea intrărilor pe sectoare: +
-(presupunem structura **Carte** definită) +
-<file cpp> +
-Carte sector[26][n]; //26 de vectori(unul pentru fiecare literă), n = suficient de mare +
-int elemInSectorul[26] = {0}; // contor pentru nrde elemente, 0 iniţial +
-for(int i = 0; i < nrCarti;i++) {  +
- int indexCurent = index(intrare[i].titlu); //în ce sector punem cartea? +
- sector[indexCurent][elemInSectorul[indexCurent]] = intrare[i]; +
- elemInSectorul[indexCurent]++; //am adăugat încă o carte +
-} //o variantă mai eficientă foloseşte 26 de liste în loc de 26 de vectori +
-</file>+
  
-**Rezultatele**:+{{ :laboratoare:sorting_quicksort_anim.gif?nolink |}}
  
- *Putem accesa direct zona din memorie unde vom pune intrarea[i], nu trebuie să-i “căutăm” locul, şi parcurgem vectorul de intrări o singură dată: complexitatea de timp O(n). 
- *Pentru acces căutăm doar în sectorul dat de funcţia index. 
  
- **Limitări**: -În cel mai bun caz, împărţim vectorul de intrări în 26 de părţi egale, deci facem căutarea de până la 26 de ori mai rapidă. În cel mai rău caz, punem tot vectorul într-un singur sector, deci pierdem timp O(n) fără câştig.+===== 4. Exerciţii =====
  
 +E0. Alegeţi un algoritm A(dintre Bubble, Insertion şi Selection) şi un algoritm B(dintre Merge şi Quick). Introduceţi nişte variabile globale cu care să contorizaţi numărul de **comparaţii** pentru algoritmii A şi B. Comparaţi rezultatele pentru un vector de întregi de lungime n = 20.
  
-====1.2 Simplificare====+E1. Implementaţi un algoritm(dintre Bubble, Insertion şi Selection) pentru sortarea unui vector cu n cuvinte de maxim 4 litere fiecare.
  
-Cum ar fi dacă, în loc de foarte multe cărţi, am avea 26 de cărţi şi, în plus, nu ar exista nicio pereche de cărţi pentru care titlurile lor să înceapă cu aceeaşi literă?+E2. Implementaţi un algoritm(dintre Merge şi Quick) pentru sortarea unui vector de structuriunde fiecare structură reprezintă un moment de timp(int ora,min,sec).
  
- *În acest caz, indexarea este perfectă: fiecare sector conţine o carte. +E3. Se dă un vector de n întregi, iar toate valorile din vector sunt între 0 şi 1000Sortaţi vectorul în timp O(n).
- *Propoziţia “Caut **o carte** pentru care titlul începe cu A” devine “**Caut cartea**…”.+
  
-=====2. Conceptele Cheie-Valoare(Key-Value)===== +<note tip>Este uşor să verificăm dacă două elemente sunt în ordine atunci când elementele au o structură simplă. Dacă avem structură mai complicată, atunci este recomandat să definim o funcţie de comparare pe care s-o apelăm pentru verificarefără a încărca funcţia de sortare.</note>
-Atunci când reorganizăm o structură de date, aşezăm într-o ordine diferită **valorile** din structura de date, folosind regulă bazată pe **cheile** acestora. +
- +
- *În exemplul nostrustructura de date este biblioteca. Aceasta conţine mai multe **cărţi**(valori), pe care le aşezăm în funcţie de **titlu**(cheie). +
- +
-=====3. Funcţia de indexare şi sectoarele(buckets)===== +
-Sectoarele sunt stocate sub formă de elemente ale unui vector. Avem nevoie de o funcţie care să facă legătura dintre cheie şi indice(index) al vectorului. +
- +
- *În exemplul nostru, funcţia **index** preia prima litera din **titlu**(cheie) şi calculează “diferenţa” dintre această literă şi prima literă din alfabet. +
- +
-=====4. Funcţia de dispersie(hash function)===== +
-Când coincide cu funcţia de indexare? +
- +
-În general, putem scrie +
-<file cpp> +
-index(cheie, nrSectoare) == hash(cheie) % nrSectoare +
-</file> +
-unde hash = funcţia de dispersie. Cu alte cuvinte, funcţia de dispersie trebuie să genereze un întreg(**oricât de mare**), folosindu-se de cheie, iar funcţia de indexare obţine un **indice**(indicele sectorului în care vom reţine cheia respectivă şi valoarea ei). +
- +
- *Coincid dacă: +
-<file cpp> +
-hash(cheie) == hash(cheie) % nrSectoare +
-</file> +
-adică atunci când valorile luate de **hash(cheie)** pot fi folosite ca **indici**(0,1,2,3,…,nrSectoare – 1). De obicei, această egalitate are loc dacă numărul de sectoare este **fixat** şi **cunoscut** de la început. +
- +
- +
- *În exemplul nostru, funcţia index nu are nevoie de nrSectoare(am considerat această valoare **mereu** egală cu **26**) şi nu apare “%26” în formulă, deci putem considera funcţia de dispersie şi funcţia de indexare **identice**. +
- *Cele mai simple funcţii hash: +
-<file cpp> +
-hash(cheie) == cheie % nrSectoare, unde cheia = întreg +
-</file>+
  
 +Puteţi utiliza următorul model pentru exerciţiile propuse: {{ :laboratoare:scheletsortare.zip |}}
  
-=====5 Avantaje/Dezavantaje=====+===== 5. Exerciţii de laborator (Linux) ===== 
 +Pentru acest laborator puteți descărca scheletul de cod de [[http://elf.cs.pub.ro/sda-ab/wiki/_media/laboratoare/lab8_sortari-skel.zip|aici]]. Descărcați arhiva și dezarhivați-o. 
  
-====5.1 Avantaje==== +=== Linux=== 
- *timp de acces(un **vector** cu sectoare) +Puteti folosi utilitarul ''%%wget%%'' pentru descarcare si utilitarul ''%%unzip%%'' pentru dezarhivare.
- *timp de inserare(fiecare sector = o **listă**)+
  
-====5.2 Dezavantaje==== +  * ''%%wget http://elf.cs.pub.ro/sda-ab/wiki/_media/laboratoare/lab8_sortari-skel.zip%%'' 
- *nu este mereu uşor de ales o funcţie pentru dispersia(**uniformă** a) cheilor +  ''%%unzip lab8_sortari-skel.zip%%''
- *pentru funcţii hash mai complexe se folosesc operaţiile bitwise(pe biţi) AND, OR şi rotaţii(shift).+
  
-====5.3 Observaţii==== +Pentru compilare folositi comanda ''%%make%%''. Pentru rulare puteti folosi comanda ''%%make run%%'' sau ''%%./sort%%''.
- *în general, un ansamblu de tipul (**structură de sectoare/buckets**) + (**funcţie de dispersie/hash**) este numit tabelă de dispersie(**Hashtable**) +
- *exemplul prezentat este demonstrativ(pentru sortare eficientă care extinde ideea, vedeţi **Radix Sort**) +
- *funcţiile hash au aplicaţii mai importante în protecţia(criptarea) datelor(vedeţi **Caesar-Cipher**, **ROT13**, **SHA-256**)+
  
laboratoare/laborator-02.txt · Ultima modificare: 2018/02/25 22:02 de către mihai.iacov