Aceasta e o versiune anterioară a paginii.

Laborator 02: Liste

1 Obiectivele laboratorului

Înțelegerea conceptului de funcționare și implementarea unor liste dublu înlănțuite și circulare
Implementarea unor funcții individuale de lucru cu aceste structuri de date.

2 Ce este o listă?

2.1 Definiție

Listele sunt cele mai bune și cele mai simple exemple a unei structuri de date dinamice care folosește pointeri la implementarea sa.în mod esențial, trebuie înțeles că listele funcționează ca un vector care se poate mări sau micșora după nevoie, din orice punct al mulțimii sale de elemente.

Avantaje ale utilizării listelor:

Elementele pot fi adăugate sau șterse din mijlocul listei
Nu trebuie definită o mărime inițială, iar memoria se alocă pe rând, odată cu fiecare element adăugat

Definirea nodului unei liste:

typedef struct {
     int val;
     node *next;
} node_t;

2.2 Clasificare

Liste simplu înlănțuite - Elementele au o singură legătură către următorul element introdus, iar ultimul

element pointează către NULL.

Liste dublu înlănțuite - Elementele au dublă legătură către precedentul și antecedentul, capul listei pointând

spre NULL și ultimul element de asemenea

Liste circulare - Pot fi simplu sau dublu înlănțuite cu proprietatea că ultimul element pointează spre primul.

2.3 Operații cu liste:

Adăugare la începutul listei
Adăugare la sfârsitul listei
Adăugarea înainte sau după un element dat
Ștergerea capului de listă
Ștergerea unui element oarecare din listă

3. Exercitii Liste

Pentru laboratorul de liste inlantuite vom porni de la o arhiva cu un schelet de laborator. Nu veti scrie codul de la zero ci veti implementa cateva functii in fisierul list.c.

Descarcati arhiva de aici si dezarhivati-o. Puteti folosi utilitarul wget pentru descarcare si utilitarul unzip pentru dezarhivare.

student@sda-ab-vm:~/Documents$ wget http://elf.cs.pub.ro/sda-ab/wiki/_media/laboratoare/lab1-skel.zip
--2017-03-02 20:45:55--  http://elf.cs.pub.ro/sda-ab/wiki/_media/laboratoare/lab1-skel.zip
Resolving elf.cs.pub.ro (elf.cs.pub.ro)... 141.85.227.116
Connecting to elf.cs.pub.ro (elf.cs.pub.ro)|141.85.227.116|:80... connected.
HTTP request sent, awaiting response... 200 OK
Length: 2368 (2,3K) [application/zip]
Saving to: ‘lab1-skel.zip’
 
lab1-skel.zip       100%[===================>]   2,31K  --.-KB/s    in 0s      
 
2017-03-02 20:45:56 (4,78 MB/s) - ‘lab1-skel.zip’ saved [2368/2368]
 
student@sda-ab-vm:~/Documents$ ls
lab1-skel.zip
student@sda-ab-vm:~/Documents$ unzip lab1-skel.zip
Archive:  lab1-skel.zip
  inflating: list.c                  
  inflating: list.h                  
  inflating: Makefile
student@sda-ab-vm:~/Documents$ make
gcc list.c -o list -std=gnu99
student@sda-ab-vm:~/Documents$ make run

Pentru compilare folositi comanda make. Pentru rulare puteti folosi fie ./list fie comanda make run.

4.Exerciții propuse pentru laborator

1. Creați o listă circulară,dublu inlănțuită cu 6 angajați ai unei companii, care să conțină următoarele referințe: nume, nr de telefon, post.

Scrieți funcțiile care să scrie urmatoarele:
Să introducă un nou angajat după al treilea.
Să introducă un nou angajat inainte de cel care e „mecanic“.
Să steargă angajatul cu un anumit număr de telefon introdus.

2. Să se creeze o listă liniara simplu inlantuita care contine elemente intregi citite dintr-ul fisier text. Se citeste apoi o valoare intreaga x. Sa se stearga primul nod care contine valoarea x. Fișierul se va da ca parametru în linia de comandă.

3.Sa se construiasca o lista liniara simplu inlantuita cu elemente numere intregi. Să se afișeze și apoi să se stearga din lista elementele pare.

Probleme opţionale - de interviu

1. Se dă o listă simplu înlănţuită(primiţi doar un pointer către primul element). Verificaţi dacă lista conţine o buclă. (o listă simplu înlănţuită conţine o buclă ⇒ niciun element nu are legătura NULL)

2. Se dau două liste(pentru fiecare listă - pointer către primul element) în formă de Y(listele se intersectează, ultimele k elemente sunt comune). Aflaţi valoarea lui k.

3. Se dă o listă cu 2n+1 elemente, fiecare element conţine câte un întreg. Toate valorile întregi apar de două ori în listă, excepţie facând una singură. Aflaţi acea valoare.

Extra: Hashtable(tabela de dispersie)

1 Introducere

(De urmărit ideea din introducere şi funcţia de indexare)

1.1 Poveste

Să presupunem urmatoarele detalii dintr-un caz real:

Situaţia: -Într-o bibliotecă sunt foarte multe cărţi şi, deşi spaţiul nu reprezintă o problemă, angajaţii nu dispun de suficient timp pentru a ordona toate cărţile după titlu(în ordine alfabetică).

Problema: -Ei vor să găsească o metodă de a pune cărţile pe rafturi în aşa fel incat să nu fie nevoie să caute prin toată biblioteca atunci când cineva are nevoie de o carte, dar să dureze mai puţin timp să le pună pe rafturi decât dacă le-ar ordona.

Soluţia generală: -Ei împart spaţiul în mai multe sectoare(un sector fiind reprezentat de unul sau de mai multe rafturi) şi decid să pună cărţile care “seamană” între ele în acelaşi sector.

O soluţie: -Ei consideră că două carţi “seamană” între ele dacă titlurile lor încep cu aceeaşi literă, aşa că au nevoie de câte un sector pentru fiecare literă cu care ar putea începe titlul unei cărţi. Folosind această regulă, angajaţii nu au nevoie de mai mult de 32 de sectoare(26 pentru engleză), adică de atâtea sectoare câte litere sunt în alfabet, deci fiecarui sector îi va corespunde o literă.

Rezultatele:

O carte poate fi pusă într-un raft imediat după ce identificăm ce sector are aceeaşi literă cu prima literă din titlul cărţii, putem lua această decizie fără a ţine cont de celelalte cărţi, deci vom avea nevoie de mai puţin timp.
Când cineva vrea să găsească o carte din bibliotecă, este suficient să caute într-un sector, nu este necesar să caute în toată biblioteca.

Limitări: -Soluţia propusă funcţionează cel mai bine atunci când sectoarele deţin(fiecare) acelaşi număr de cărţi. Ce se întâmplă atunci când un sector este mult mai mare decât celelalte? (Multe titluri încep cu “The” în engleză)

Concluzie: -Trebuie să alegem cu grijă regula după care spunem că două cărţi “seamănă” între ele. O regulă simplă ne face treaba mai uşoară la aşezare, dar mai grea la căutare. O regulă complicată face pe dos: mai greu la aşezare, dar mai uşor la căutare.

Folosind o abordare mai tehnică, să urmărim aceleaşi detalii:

Situaţia: -se dă un vector(sau o listă) cu foarte multe intrări şi, deşi spaţiul(memoria) nu reprezintă o problemă, nu dispunem de suficient timp încât să efectuăm o sortare completă(alfabetică, dupa nişte titluri = şiruri de caractere).

Problema: -căutăm o “semi-sortare” a intrărilor care să fie cât mai rapidă şi care să aducă un avantaj(faţă de păstrarea într-o ordine întâmplătoare) atunci când vrem să accesăm anumite intrări.

Soluţia generală: -împarţim spaţiul în mai multe sectoare(un sector fiind reprezentat de un vector sau de o listă), punem intrările care “seamană” între ele în acelaşi sector.

O soluţie: -alegem ca un sector să reprezinte o literă şi aceea să fie litera cu care încep toate titlurile intrărilor din acel sector. În realitate, sectoarele pot fi notate cu litere, dar, într-un limbaj de programare, le notăm cu numere pentru a lucra mai uşor.

Functia index dă valorile {0,1,2,…} pentru titluri care încep cu literele {‘A’,’B’,’C’,…}. Această funcţie se foloseşte de codul ASCII, deci ne limităm la alfabetul limbii engleze.

   unsigned int index(char[] titlu) { return (titlu[0] - ‘A’); }

Ignorând problema spaţiului, definim secvenţa pentru distribuirea intrărilor pe sectoare:

(presupunem structura Carte definită)

Carte sector[26][n]; //26 de vectori(unul pentru fiecare literă), n = suficient de mare
int elemInSectorul[26] = {0}; // contor pentru nr. de elemente, 0 iniţial
for(int i = 0; i < nrCarti;i++) { 
	int indexCurent = index(intrare[i].titlu); //în ce sector punem cartea?
	sector[indexCurent][elemInSectorul[indexCurent]] = intrare[i];
	elemInSectorul[indexCurent]++; //am adăugat încă o carte
} //o variantă mai eficientă foloseşte 26 de liste în loc de 26 de vectori

Rezultatele:

Putem accesa direct zona din memorie unde vom pune intrarea[i], nu trebuie să-i “căutăm” locul, şi parcurgem vectorul de intrări o singură dată: complexitatea de timp O(n).
Pentru acces căutăm doar în sectorul dat de funcţia index.

Limitări: -În cel mai bun caz, împărţim vectorul de intrări în 26 de părţi egale, deci facem căutarea de până la 26 de ori mai rapidă. În cel mai rău caz, punem tot vectorul într-un singur sector, deci pierdem timp O(n) fără câştig.

1.2 Simplificare

Cum ar fi dacă, în loc de foarte multe cărţi, am avea 26 de cărţi şi, în plus, nu ar exista nicio pereche de cărţi pentru care titlurile lor să înceapă cu aceeaşi literă?

În acest caz, indexarea este perfectă: fiecare sector conţine o carte.
Propoziţia “Caut o carte pentru care titlul începe cu A” devine “Caut cartea…”.

2. Conceptele Cheie-Valoare(Key-Value)

Atunci când reorganizăm o structură de date, aşezăm într-o ordine diferită valorile din structura de date, folosind o regulă bazată pe cheile acestora.

În exemplul nostru, structura de date este biblioteca. Aceasta conţine mai multe cărţi(valori), pe care le aşezăm în funcţie de titlu(cheie).

3. Funcţia de indexare şi sectoarele(buckets)

Sectoarele sunt stocate sub formă de elemente ale unui vector. Avem nevoie de o funcţie care să facă legătura dintre cheie şi indice(index) al vectorului.

În exemplul nostru, funcţia index preia prima litera din titlu(cheie) şi calculează “diferenţa” dintre această literă şi prima literă din alfabet.

4. Funcţia de dispersie(hash function)

Când coincide cu funcţia de indexare?

În general, putem scrie

index(cheie, nrSectoare) == hash(cheie) % nrSectoare

unde hash = funcţia de dispersie. Cu alte cuvinte, funcţia de dispersie trebuie să genereze un întreg(oricât de mare), folosindu-se de cheie, iar funcţia de indexare obţine un indice(indicele sectorului în care vom reţine cheia respectivă şi valoarea ei).

Coincid dacă:

hash(cheie) == hash(cheie) % nrSectoare

adică atunci când valorile luate de hash(cheie) pot fi folosite ca indici(0,1,2,3,…,nrSectoare – 1). De obicei, această egalitate are loc dacă numărul de sectoare este fixat şi cunoscut de la început.

În exemplul nostru, funcţia index nu are nevoie de nrSectoare(am considerat această valoare mereu egală cu 26) şi nu apare “%26” în formulă, deci putem considera funcţia de dispersie şi funcţia de indexare identice.
Cele mai simple funcţii hash:

hash(cheie) == cheie % nrSectoare, unde cheia = întreg

5 Avantaje/Dezavantaje

5.1 Avantaje

timp de acces(un vector cu sectoare)
timp de inserare(fiecare sector = o listă)

5.2 Dezavantaje

nu este mereu uşor de ales o funcţie pentru dispersia(uniformă a) cheilor
pentru funcţii hash mai complexe se folosesc operaţiile bitwise(pe biţi) AND, OR şi rotaţii(shift).

5.3 Observaţii

în general, un ansamblu de tipul (structură de sectoare/buckets) + (funcţie de dispersie/hash) este numit tabelă de dispersie(Hashtable)
exemplul prezentat este demonstrativ(pentru sortare eficientă care extinde ideea, vedeţi Radix Sort)
funcţiile hash au aplicaţii mai importante în protecţia(criptarea) datelor(vedeţi Caesar-Cipher, ROT13, SHA-256)

Structuri de Date și Algoritmi (seria 1AB)

Bara de navigare

Cuprins

Laborator 02: Liste

1 Obiectivele laboratorului

2 Ce este o listă?

2.1 Definiție

2.2 Clasificare

2.3 Operații cu liste:

3. Exercitii Liste

4.Exerciții propuse pentru laborator

Probleme opţionale - de interviu

Extra: Hashtable(tabela de dispersie)

1 Introducere

1.1 Poveste

Să presupunem urmatoarele detalii dintr-un caz real:

Folosind o abordare mai tehnică, să urmărim aceleaşi detalii:

1.2 Simplificare

2. Conceptele Cheie-Valoare(Key-Value)

3. Funcţia de indexare şi sectoarele(buckets)

4. Funcţia de dispersie(hash function)

5 Avantaje/Dezavantaje

5.1 Avantaje

5.2 Dezavantaje

5.3 Observaţii

Structuri de Date și Algoritmi (seria 1AB)

Unelte utilizator

Unelte site

Bara de navigare

Cuprins

Laborator 02: Liste

1 Obiectivele laboratorului

2 Ce este o listă?

2.1 Definiție

2.2 Clasificare

2.3 Operații cu liste:

3. Exercitii Liste

4.Exerciții propuse pentru laborator

Probleme opţionale - de interviu

Extra: Hashtable(tabela de dispersie)

1 Introducere

1.1 Poveste

Să presupunem urmatoarele detalii dintr-un caz real:

Folosind o abordare mai tehnică, să urmărim aceleaşi detalii:

1.2 Simplificare

2. Conceptele Cheie-Valoare(Key-Value)

3. Funcţia de indexare şi sectoarele(buckets)

4. Funcţia de dispersie(hash function)

5 Avantaje/Dezavantaje

5.1 Avantaje

5.2 Dezavantaje

5.3 Observaţii

Unelte pagină