Aici sunt prezentate diferențele dintre versiunile selectate și versiunea curentă a paginii.
Ambele părți revizuirea anterioară Versiuni anterioare Urmatoarea versiune | Versiuni anterioare Ultima versiune Ambele părți următoarea reviziune | ||
laboratoare:laborator-02 [2017/02/20 00:42] florina_elena.barbu [4. Funcţia de dispersie(hash function)] |
laboratoare:laborator-02 [2018/02/25 21:47] mihai.iacov |
||
---|---|---|---|
Linia 1: | Linia 1: | ||
- | ====== Laborator 02: Liste ====== | + | ====== Laborator 02: Algoritmi de sortare 1 ====== |
- | \\ | + | |
- | =====1 Obiectivele laboratorului===== | + | |
- | *Înțelegerea conceptului de funcționare și implementarea unor liste dublu înlănțuite și circulare | + | |
- | *Implementarea unor funcții individuale de lucru cu aceste structuri de date. | + | |
- | \\ | + | |
- | =====2 Ce este o listă?===== | + | =====1. Obiectivele laboratorului===== |
- | ====2.1 Definiție==== | + | |
- | Listele sunt cele mai bune și cele mai simple exemple a unei structuri de date dinamice care folosește pointeri | + | |
- | la implementarea sa.în mod esențial, trebuie înțeles că listele funcționează ca un vector care se poate mări sau | + | |
- | micșora după nevoie, din orice punct al mulțimii sale de elemente. | + | |
- | {{ :laboratoare: | + | Propunem studierea următorilor algoritmi de sortare: |
+ | * Bubble Sort | ||
+ | * Selection Sort | ||
+ | * Insertion Sort | ||
+ | * Merge Sort | ||
+ | * Quick Sort | ||
- | Avantaje ale utilizării listelor: | + | =====2. Introducere===== |
- | *Elementele pot fi adăugate sau șterse din mijlocul listei | + | |
- | *Nu trebuie definită o mărime inițială, iar memoria se alocă pe rând, odată cu fiecare element adăugat | + | |
- | Definirea nodului unei liste: | + | ==== 2.1 Calculul complexităţii algoritmilor ==== |
- | <file cpp> | + | |
- | typedef struct node{ | + | |
- | int val; | + | |
- | | + | |
- | }node t; | + | |
- | </ | + | |
- | ====2.2 Clasificare==== | + | Analiza complexității unui algoritm are ca scop estimarea volumului de resurse de calcul necesare pentru execuția algoritmului. Prin resurse se înțelege: |
- | * **Liste simplu înlănțuite** - Elementele au o singură legătură către următorul element introdus, iar ultimul | + | • //Spațiul de memorie// necesar pentru stocarea datelor pe care le prelucrează algoritmul.\\ |
- | element pointează către NULL. | + | • //Timpul necesar pentru execuția// tuturor prelucrărilor specificate în algoritm. |
- | {{ : | + | Această analiză este utilă pentru a stabili dacă un algoritm utilizează un volum acceptabil de resurse pentru rezolvarea unei probleme. In acest fel timpul de executie va fi exprimat prin numarul de operatii elementare executate. Sunt considerate operatii elementare cele aritmetice (adunare, scadere, ınmulțire, ımpartire), |
+ | Este așadar suficient sa se contorizeze doar anumite tipuri de operații elementare, | ||
- | * **Liste dublu înlănțuite** - Elementele au dublă legătură către precedentul și antecedentul, capul listei pointând | + | **Exemplul 1 - Suma a n numere** \\ |
- | spre NULL și ultimul element | + | Consideram problema calculului sumei . Dimensiunea acestei probleme poate fi considerata // |
+ | problemei. | ||
+ | {{ : | ||
- | {{ : | ||
- | * **Liste circulare** - Pot fi simplu sau dublu înlănțuite cu proprietatea că ultimul element pointează spre primul. | + | **Exemplul 2 - Înmulțirea a 2 matrici** \\ |
+ | Consideram problema determinarii produsului a doua matrici: A de dimensiune m×n si B de dimensiune n×p. In acest caz dimensiunea problemei este determinata de trei valori: (m, n, p). \\ | ||
+ | In practica nu este necesara o analiza atat de detaliata ci este suficient sa se identifice | ||
+ | operatia dominantă si sa se estimeze numarul de repetari ale acesteia. Prin operatie dominanta se ıntelege operatia care contribuie cel mai mult la timpul de executie a algoritmului si de regulă este operatia ce apare ın ciclul cel mai interior. În exemplul | ||
- | {{ : | + | {{ : |
- | ====2.3 Operații cu liste: | + | ---- |
- | *Adăugare la începutul listei | + | |
- | *Adăugare la sfârsitul listei | + | |
- | *Adăugarea înainte sau după un element dat | + | |
- | *Ștergerea capului de listă | + | |
- | *Ștergerea unui element oarecare din listă | + | |
+ | ====2.2 Caracterizarea unui algoritm==== | ||
- | =====3.Exerciții propuse pentru laborator===== | + | Numim **sortare** orice aşezare(sau - mai clar - **reaşezare**) a unor elemente date în aşa fel încât, după aşezare, să existe o **ordine completă** în funcţie de un atribut(numit **cheie**) al elementelor. |
- | 1. Creați o listă circulară,dublu inlănțuită cu 6 angajați ai unei companii, care să conțină următoarele referințe: nume, nr de telefon, post. | + | |
- | | + | |
- | | + | |
- | | + | |
- | | + | |
- | 2. Să se creeze | + | Pentru a exista |
- | Se citeste apoi o valoare intreaga x. Sa se stearga primul nod care contine valoarea x. | + | |
- | Fișierul se va da ca parametru în linia de comandă. | + | |
- | 3.Sa se construiasca o lista liniara simplu inlantuita cu elemente numere intregi. Să se afișeze și apoi să se stearga din lista elementele pare. | + | Exemplu: dacă alegem drept cheie un atribut **număr întreg** şi relaţia **mai mic sau egal**(< |
+ | Vom descrie un algoritm de sortare prin: | ||
+ | *timp mediu - timpul de execuţie la care ne aşteptăm, **în medie**, pentru sortare | ||
+ | *timp la limită- timpul de execuţie pentru **cel mai rău** caz posibil | ||
+ | | ||
+ | | ||
+ | Folosim notaţia O(n) pentru a indica: | ||
+ | *un număr de operaţii de ordinul lui n. În acest caz, spunem că avem " | ||
+ | *o dimensiune de ordinul lui n pentru memoria alocată. În acest caz, spunem că avem " | ||
- | ====== Extra: Hashtable(tabela de dispersie)====== | ||
- | =====1 Introducere===== | + | ====2.3 Metodele de sortare folosite==== |
- | (De urmărit ideea din introducere şi funcţia | + | Fiecare algoritm se bazează pe o metodă de sortare: |
+ | | ||
+ | | ||
+ | | ||
+ | | ||
+ | | ||
- | ====1.1 Poveste==== | ||
- | ===Să presupunem urmatoarele detalii dintr-un caz real:=== | + | =====3. Algoritmii===== |
- | | + | ====3.1 Bubble sort==== |
- | **Problema**: -Ei vor să găsească o metodă de a pune cărţile pe rafturi în aşa fel incat să nu fie nevoie să caute prin toată biblioteca atunci când cineva are nevoie de o carte, dar să dureze mai puţin timp să le pună pe rafturi decât dacă le-ar ordona. | + | * timp mediu: O(N^2) |
+ | | ||
+ | | ||
+ | | ||
- | | + | ===Descriere :=== |
+ | Sortarea prin metoda bulelor se consideră drept una din cele mai puţin efective metode de | ||
+ | sortare, dar cu un algoritm | ||
- | **O soluţie**: -Ei consideră că două carţi “seamană” între ele dacă titlurile lor încep cu aceeaşi literă, aşa că au nevoie | + | *Ideea de bază a sortării prin metoda bulelor este în a parcurge tabloul, de la stânga spre dreapta, |
+ | fiind comparate elementele alăturate **a[i] si a[i+1]**. Dacă vor fi găsite 2 elemente neordonate, | ||
+ | valorile lor vor fi interschimbate. | ||
+ | | ||
+ | elemente neordonate. | ||
- | | + | {{ :laboratoare: |
- | *O carte poate fi pusă într-un raft imediat după ce identificăm ce sector are aceeaşi literă cu prima literă din titlul cărţii, putem lua această decizie fără a ţine cont de celelalte cărţi, deci vom avea nevoie de mai puţin timp. | + | |
- | *Când cineva vrea să găsească o carte din bibliotecă, | + | |
- | | + | ===Implementare |
+ | <file cpp> | ||
+ | //sortare descrescatoare | ||
+ | void bubble(int a[],int n) | ||
+ | { | ||
+ | int i, | ||
+ | do { | ||
+ | schimbat = 0; | ||
+ | // parcurgem vectorul | ||
+ | for(i = 0; i < n-1; i++) { | ||
+ | // daca valoarea i din vectorul a este mai mica decat cea de pe pozitia i+1 | ||
+ | if (a[i] < a[i+1]) { | ||
+ | // interschimbare | ||
+ | aux = a[i]; | ||
+ | a[i] = a[i+1]; | ||
+ | a[i+1] = aux; | ||
+ | schimbat = 1; | ||
+ | } | ||
+ | } | ||
+ | } while(schimbat); | ||
+ | } | ||
+ | </ | ||
- | | + | ====3.2 Selection sort==== |
- | ===Folosind o abordare mai tehnică, să urmărim aceleaşi detalii:=== | + | * timp mediu: O(N^2) |
+ | * timp la limită: O(N^2) | ||
+ | * memorie: O(1) | ||
+ | * Stabil: DA | ||
- | | + | ===Descriere |
+ | Acest algoritm selectează, la fiecare pas i, cel mai mic element din vectorul nesortat(de la poziţia | ||
+ | i până la n).Valoarea minimă găsită la pasul i este pusă în vector la poziţia | ||
+ | intereschimbarea cu poziţia actuală a minimului.Nu este un algoritm indicat pentru vectorii | ||
+ | mari, în majoritatea cazurilor oferind rezultate mai slabe decât | ||
+ | {{ : | ||
- | | + | ===Implementare |
+ | <file cpp> | ||
+ | void selectionSort(int a[],int n) | ||
+ | { | ||
+ | int i, | ||
+ | for(i = 0; i < n - 1;i++) | ||
+ | { | ||
+ | minPoz = i; | ||
+ | min = a[i]; | ||
+ | for(j = i + 1;j < n;j++) //selectam minimul | ||
+ | //din vectorul ramas( de la i+1 la n) | ||
+ | { | ||
+ | if(min > a[j]) //sortare crescatoare | ||
+ | { | ||
+ | minPoz = j; //pozitia elementului minim | ||
+ | min = a[j]; | ||
+ | } | ||
+ | } | ||
+ | aux = a[i] ; | ||
+ | a[i] = a[minPoz]; // | ||
+ | a[minPoz] = aux; | ||
+ | } | ||
+ | } | ||
+ | </ | ||
+ | |||
+ | ====3.3 Insertion sort==== | ||
+ | |||
+ | * timp mediu: O(N^2) | ||
+ | * timp la limită: O(N^2) | ||
+ | * memorie: O(1) | ||
+ | * Stabil: DA | ||
- | **Soluţia generală**: -împarţim spaţiul în mai multe sectoare(un sector fiind reprezentat de un vector sau de o listă), punem intrările care “seamană” între ele în acelaşi sector. | + | ===Descriere :=== |
+ | Spre deosebire de alţi algoritmi de sortare, sortarea prin inserţie este folosită destul de des | ||
+ | pentru sortarea tablourilor cu **număr mic de elemente**. De exemplu, poate fi folosit pentru a | ||
+ | îmbunătăţi rutina de sortare rapidă. | ||
+ | | ||
+ | imaginar | ||
+ | primul element al tabloului şi partea nesortată conţine restul tabloului. | ||
+ | *La fiecare pas, algoritmul ia primul element din partea nesortată şi il inserează în locul potrivit al părţii sortate. | ||
+ | | ||
- | **O soluţie**: -alegem ca un sector să reprezinte o literă şi aceea să fie litera cu care încep toate titlurile intrărilor din acel sector. În realitate, sectoarele pot fi notate cu litere, dar, într-un limbaj de programare, le notăm cu numere pentru a lucra mai uşor. | + | {{ :laboratoare: |
- | * Functia index dă valorile **{0, | + | ===Implementare |
- | < | + | |
- | | + | |
- | </ | + | |
- | + | ||
- | * Ignorând problema spaţiului, definim secvenţa pentru distribuirea intrărilor pe sectoare: | + | |
- | (presupunem structura **Carte** definită) | + | |
<file cpp> | <file cpp> | ||
- | Carte sector[26][n]; //26 de vectori(unul pentru fiecare literă), n = suficient de mare | + | void insertionSort(int a[], int n) |
- | int elemInSectorul[26] = {0}; // contor pentru nr. de elemente, 0 iniţial | + | { |
- | for(int i = 0; i < nrCarti;i++) { | + | |
- | int indexCurent | + | for (i = 1; i < n; i++) |
- | sector[indexCurent][elemInSectorul[indexCurent]] = intrare[i]; | + | |
- | elemInSectorul[indexCurent]++; //am adăugat încă o carte | + | |
- | } //o variantă mai eficientă foloseşte 26 de liste în loc de 26 de vectori | + | while (j > 0 && a[j - 1] > a[j]) |
+ | { //cautam pozitia pe care sa mutam a[i] | ||
+ | aux = a[j]; // | ||
+ | a[j] = a[j - 1]; | ||
+ | a[--j] = aux; | ||
+ | } | ||
+ | } | ||
+ | } | ||
</ | </ | ||
- | **Rezultatele**: | + | ====3.4 Merge sort==== |
- | *Putem accesa direct zona din memorie unde vom pune intrarea[i], | + | * timp mediu: O(N log N) |
- | *Pentru acces căutăm doar în sectorul dat de funcţia index. | + | |
+ | * memorie: O(N) | ||
+ | * Stabil: DA | ||
- | | + | ===Descriere |
+ | În cazul sortării prin interclasare, vectorii care se interclasează sunt două secvenţe ordonate | ||
+ | din acelaşi vector. | ||
+ | Sortarea prin interclasare utilizează metoda **Divide et Impera**: | ||
+ | *se împarte vectorul în secvenţe din ce în ce mai mici, astfel încât fiecare secvenţă să fie | ||
+ | ordonată la un moment dat şi interclasată cu o altă secvenţă din vector corespunzătoare. | ||
+ | | ||
- | ====1.2 Simplificare==== | + | {{ : |
- | Cum ar fi dacă, în loc de foarte multe cărţi, am avea 26 de cărţi şi, în plus, nu ar exista nicio pereche de cărţi pentru care titlurile lor să înceapă cu aceeaşi literă? | + | ====3.5 Quick sort==== |
- | *În acest caz, indexarea este perfectă: fiecare sector conţine o carte. | + | * timp mediu: O(N log N) |
- | *Propoziţia “Caut | + | |
+ | * memorie: O(log N) | ||
+ | | ||
- | =====2. Conceptele Cheie-Valoare(Key-Value)===== | + | ===Descriere :=== |
- | Atunci când reorganizăm o structură de date, aşezăm într-o ordine diferită | + | Quick Sort este unul dintre cei mai rapizi şi mai utilizaţi algoritmi de sortare până în acest moment,bazându-se pe tehnica "**Divide et impera**" |
- | *În exemplul nostru, structura | + | Algoritmul se bazează pe următorii paşi: |
+ | *alegerea unui element pe post de **pivot** | ||
+ | | ||
+ | | ||
+ | | ||
- | =====3. Funcţia de indexare şi sectoarele(buckets)===== | + | < |
- | Sectoarele sunt stocate sub formă de elemente ale unui vector. Avem nevoie de o funcţie care să facă legătura dintre cheie şi indice(index) al vectorului. | + | |
- | *În exemplul nostru, funcţia **index** preia prima litera din **titlu**(cheie) şi calculează “diferenţa” dintre această literă şi prima literă din alfabet. | + | {{ : |
- | =====4. Funcţia de dispersie(hash function)===== | ||
- | Când coincide cu funcţia de indexare? | ||
- | În general, putem scrie | + | ===== 4. Exerciţii ===== |
- | <file cpp> | + | |
- | index(cheie, | + | |
- | </ | + | |
- | unde hash = funcţia de dispersie. Cu alte cuvinte, funcţia de dispersie trebuie să genereze un întreg(**oricât de mare**), folosindu-se de cheie, iar funcţia de indexare obţine un **indice**(indicele sectorului în care vom reţine cheia respectivă şi valoarea ei). | + | |
- | | + | E0. Alegeţi un algoritm A(dintre Bubble, Insertion şi Selection) şi un algoritm B(dintre Merge şi Quick). Introduceţi nişte variabile globale cu care să contorizaţi |
- | <file cpp> | + | |
- | hash(cheie) == hash(cheie) % nrSectoare | + | |
- | </ | + | |
- | adică atunci când valorile luate de **hash(cheie)** pot fi folosite ca **indici**(0, | + | |
+ | E1. Implementaţi un algoritm(dintre Bubble, Insertion şi Selection) pentru sortarea unui vector cu n cuvinte de maxim 4 litere fiecare. | ||
- | *În exemplul nostru, funcţia index nu are nevoie de nrSectoare(am considerat această valoare **mereu** egală cu **26**) şi nu apare “%26” | + | E2. Implementaţi un algoritm(dintre Merge şi Quick) pentru sortarea unui vector de structuri, unde fiecare structură reprezintă un moment de timp(int ora,min,sec). |
- | *Cele mai simple funcţii hash: | + | |
- | <file cpp> | + | E3. Se dă un vector de n întregi, iar toate valorile din vector sunt între 0 şi 1000. Sortaţi vectorul |
- | hash(cheie) == cheie % nrSectoare, unde cheia = întreg | + | |
- | </file> | + | <note tip>Este uşor să verificăm dacă două elemente sunt în ordine atunci când elementele au o structură simplă. Dacă avem o structură mai complicată, atunci este recomandat să definim o funcţie de comparare pe care s-o apelăm pentru verificare, fără a încărca |
+ | Puteţi utiliza următorul model pentru exerciţiile propuse: {{ : | ||
- | =====5 | + | ===== 5. Exerciţii de laborator (Linux) |
+ | Pentru acest laborator puteți descărca scheletul de cod de [[http:// | ||
- | ====5.1 Avantaje==== | + | === Linux=== |
- | *timp de acces(un **vector** cu sectoare) | + | Puteti folosi utilitarul '' |
- | *timp de inserare(fiecare sector = o **listă**) | + | |
- | ====5.2 Dezavantaje==== | + | * '' |
- | *nu este mereu uşor de ales o funcţie pentru dispersia(**uniformă** a) cheilor | + | * '' |
- | *pentru funcţii hash mai complexe se folosesc operaţiile bitwise(pe biţi) AND, OR şi rotaţii(shift). | + | |
- | ====5.3 Observaţii==== | + | Pentru compilare folositi comanda '' |
- | *în general, un ansamblu de tipul (**structură de sectoare/buckets**) + (**funcţie de dispersie/ | + | |
- | | + | |
- | | + | |