It's a 101 C course for my students. Sorry, only italian version so far.
Il corso è fondamentalmente pratico, non è richiesto alcun prerequisito e nulla è dato per scontato. Prima di iniziare è giusto ricordare che per svolgere i laboratori richiesti è necessaria la conoscenza di alcuni strumenti, in particolare:
- git
- virtualbox Installa la versione 7.0 che è la più recente compatibile con vagrant. Leggi qui per maggiori info
- Microsoft Visual C++ Solo in caso ti venga richiesto durante l'installaizone di VBox (dovrebbe andare in errore)
- vagrant
I link forniti sopra portano alle versioni dei software per architettura amd64
in ambiente windows
, questo a causa dell'assenza di macchine linux nei lab scolastici.
GIT e VAGRANT ci serviranno per ottenere un ambiente di sviluppo identico per tutti e per un provisioning automatico; in altre parole git ci permetterà di condividere il codice dei laboratori e vagrant di condividere la stessa macchina virtuale (ubuntu-22.04
) con l'ambiente di sviluppo preinstallato.
I passi seguenti permettono di duplicare sulla tua macchina locale l'ambiente di sviluppo (codice e vm).
Nella directory radice del progetto (2cornot2c
che otterrai clonando il repository nei passi seguenti) troverai una directory lab
con il codice c per tutti laboratori.
Questa cartella 2cornot2c\lab
è montata automaticamente sul file system della macchina virtuale nella cartella /lab
.
Tutto quello che verrà modificato sulla macchina linux in lab
( vm o macchina guest) verrà visto sulla macchina windows (host) in 2cornot2c\lab
.
- Clona il repository con il codice ed il Vagrantfile
git clone /~https://github.com/kinderp/2cornot2c.git
- Entra dentro la directory root del repository
cd 2cornot2c
- Avvia la macchina virtuale
vagrant up
- Apri una sessione ssh sulla macchina appena avviata
vagrant ssh
/lab
nella macchian Linux troverai il codice su cui lavorare.
Ogni lab ha un numero ed un nome ad esso associato, ad esempio al primo laboratorio è assegnato il numero 0
ed il nome intro
; questo significa che per questo lab esisterà una cartella lab/0_intro
che conterrà tutto il codice del lab. All'interno della cartella del laboratorio troverai dei file sorgente con estensione .c
o h
anche questi con un numero ed un nome; ad esempio il primo sorgente del lab 0_intro
è 0_hello.c
.
Ogni lab al suo interno contiene una cartella bin
destinata ad ospitare i file eseguibili ottenuti al termine del processo di compilazione.
I programmi sono scriti in un qualche linguaggio di programmazione, il programmatore scrive il codice sorgente; nel caso del linguaggio C i file sorgente hanno estensione .c
o .h
. Il codice sorgente contiene tutte le istruzioni che il programma dovrà eseguire. Le istruzioni all'interno del codice sorgente scritte in un qualsiasi linguaggio di programmazione devono essere tradotte in una sequenza di bit (in altri termini nel linguaggio macchina) perchè la cpu è in grado di comprendere solo il linguaggio macchina, esclusivamente sequenze di bit e nient'altro. In sintesi si dice che il programma sorgente deve essere trasformato in in file eseguibile (file binario) che contiene le istruzioni (sequenze di bit) per la pecifica architettura del nostro processore.
Questo processo di trasformazione del sorgente in binario è detto processo di compilazione ed è svolto del compilatore. In realtà queto processo è articolato in vari step e non coinvolge solo il compilatore. Vediamo brevemente di studiarne le fasi.
Se non lo hai già fatto avvia la macchina virtuale con vagrant up
ed al termine del boot avvia una sessione ssh con il comando vagrant ssh
.
Una volta dentro nella tue home directory (utente vagrant) usa vim per creare un nuovo file in questo modo: vim hello.c
e copia il codice mostrato sotto:
#include <stdio.h>
int main(void){
printf("Hello World");
}
Salva il contenuto premendo la combinazione: Esc
+ :wq
.
Compila il sorgente hello.c
lanciando il seguente comando: gcc -o hello hello.c
; gcc è il compilatore che useremo in questo corso, lo trovi già installato sulla vm. In questo caso l'opzione -o
specifica il nome del file oggetto (il file binario eseguibile) che vogliamo creare; ovviamente dobbiamo specificare successivamente il sorgente da cui partire per la generazione dell'eseguibile (hello.c
). Se tutto ha funzionato puoi lanciare il programma appena compilato in questo modo: ./hello
. Come avrai avuto modo di constatare il programma ha stampato a schermo la frase Hello World
; per fare ciò il programmatore si è servito di un pezzo di codice già pronto (in sostenza la funzione printf()
). Per informare il compilatore circa il corretto uso di questo pezzo di codice (la funzione printf()
) è stata inserita nella prima riga del programma la direttiva al preprocessore #include
. Vedremo in dettaglio cosa vuol dire usare una funzione esterna e come includere con le direttive il suo prototipo, per adesso ci basta sapere che per stampare è stata usata una funzione già pronta ed è stato necessario informare il compilatore di questo.
Nella figura di sopra è mostato l'intero processo di compilazione che è composto da almeno quattro fasi; come puoi vedere i due parametri passati al compilatore con: gcc -o hello hello.c
sono ripsettivamente il nome del file di input del processo (hello.c
) cioè il sorgente di partenza ed il file di output (hello
) cioè l'eseguibile.
Volendo è possibile richiedere al compilatore di fermarsi ad uno specifico step senza produrre l'output finale. Le quattro fasi del processo di compilazione sono rispettivamente:
- Preprocessamento (Preprocessing):
il preprocessore (cpp
) esegue sostituzioni di testo, disabilita/abilita condizionalmente parti di codice in fase di compilazione. Il risultato della sua elaborazione è un file con estensione .i
: nel nostro caso quindi hello.i
. Per bloccare il processo di compilazione alla fase di preprocessamento puoi eseguire questo comando: gcc -E hello.c > hello.i
. Il file hello.i
conterrà tutte le sostituzioni effettuate dal preprocessore e come puoi vedere quindi ha molto più contenuto del file di partenza hello.c
, spiegheremo le chiamate al preprocessore nei prossimi paragrafi.
- Compilazione (Compilation):
il compilatore (cc
) trasforma il contenuto testuale del file hello.i
(che è scritto in codice c) nel corrispettivo codice assembly (hello.s
) specifico per l'architettura del processore target. Puoi bloccare il processo alla fase di compilazione producendo il corrispettivo codice assembly in questo modo: gcc -S -masm=intel hello.c
- Assemblaggio (Assembly):
l'assemblatore as
trasforma il codice assembly contenuto in hello.s
nelle istruzioni macchina dell'architettura della cpu, il risultato è il file oggetto rilocabile hello.o
. Puoi bloccare il processo in questa fase con il comando: gcc -c hello.c
- Linkaggio (Linking):
il linker (ld
) ha il compito di aggreggare in un unico file oggetto (il file eseguibile) eventuali altri file oggetto di librerie esterne o del linguaggio. Nel nostro esempio il programmatore ha fatto uso di una funzione del linguaggio (printf()
) quindi il linker aggregerà nel file eseguibile (hello
) il file oggetto hello.o
ed il file oggetto relativo al codice della funzione printf: printf.o
. Puoi generare il file eseguibile in questo modo: gcc -o hello hello.c
Un programma C è di fatto una collezione di:
- Variabili
- Costanti
- Funzioni
- Chiamate al preprocessore
Di seguito provvederemo a dare una definizione sommaria per ogni componente sopra citato, rimandiamo ai singoli paragrafi per una trattazione completa.
Important
Una variabile è una locazione di memoria a cui è stato associato un identificatore cioè un nome per referenziare nel codice quella cella di memoria
Una variabile ha un tipo; il tipo associato ad una variabile definisce appunto che tipo di dato essa può contenere (un numero intero, un numero reale, un carattere etc.) in altre parole il tipo della variabile definisce il numero di byte occupati dalla locazione di memoria referenziata dall'identificatore Una variabile può cambiare il valore in essa contenuto durante il ciclo di vita del programma. L'operazione mediante la quale si assegna un valore iniziale ad una variabile è detto inizializzazione, l'operazione attraverso cui si associa un nuovo valore ad una variabile già inizializzata è detto assegnamento Prima di usare una variabile è necessario prima dichiararla cioè assegnarle un tipo ed un identificatore.
int var_intera; // dichiarazione di variabile senza inizializzazione
var_intera = 5; // assegnamento di varabile precedentemente inizalizzata
int var_intera_inizializzata = 3; // dichirazione di variabile con inizializzazione
var_intera_inizializzata = 9; // assegnamento
Warning
Le variabili possono essere sia dichiarate che definite e spesso due termini sono usati per esprimere la stessa cosa. E' prematuro spiegarne la lieve differenza ma tieni a mente per adesso i due termini non sono la stessa cosa.
Important
Per la costante valgono le stesse considerazioni fatte per le variabili con l'eccezione che per le costanti non è possibile assegnare un nuovo valore una volta che questa è stata inizializzata
const double pi = 3.14; // costante pi greco
Important
Una funzione è una collezione di istruzioni che svolgono uno specifico compito
una funzione ha un nome (differenza
nel nostro esempio), un valore di ritorno, dei parametri di input (minuendo
e sottraendo
nel codice d'esempio) ed un corpo che è delimitato da una parenti graffa aperta {
ed una chiusa }
.
I parametri d'ingresso detti anche parametri formali sono racchiusi tra una coppia di parentesi tonde: (
, )
.
int differenza(int minuendo, int sottraendo){
return minuendo - sottraendo;
}
Important
Il preprocessore viene richiamato dal compilatore come primo step nel processo di generazione del file eseguibile. Il preprocessore ha il compito di effettuare delle semplici sostituzioni di testo; esistono diverse sostituzioni che il preprocessore può effettuare per conto nostro. L'insieme di queste operazioni sono dette chiamate al preprocessore.
Come da tradizione, il primo esempio di codice è il classico Hello World
.
Il programma di sotto stampa a schermo una semplice frase: Ciao Mondo
in inglese.
#include <stdio.h>
int main(void){
printf("Hello World\n");
return 0;
}
Compila il sorgente con: gcc -o 0_hello bin/0_hello
e poi esegui il programma con: bin/0_hello
.
Riconosciamo subito una funzione: main()
. Questa è una funzione speciale, tutti i programmi C devono averne una in quanto rappresenta il punto di partenza per l'esecuzione di ogni programma. Sei libero di chiamare tutte le altre funzioni a tuo piacimento ma la funzione da cui parte l'esecuzione si deve chiamare main()
. Come qualsiasi funzione, main()
ha un tipo di ritorno int
e dei parametri in ingresso opzionali, in questo caso la funzione main()
non si aspetta nessun parametro in ingresso dal chiamante (il sistema operativo) e per esprimere che questa non accetta alcun valore in ingresso si usa la parola riservata void
.
Ti potrebbe capitare di vedere la funzione main()
in queste versioni:
main()
void main()
La prima forma è tollerata da vecchia versioni del C (C90) o pre ANSI C ma non è accettata da quelle successive (C99, C11); la seconda potrebbe essere tollerata da alcuni compilatori ma se il tuo codice deve funzionare anche su altre macchine è meglio usare qualcosa che funziona sempre: dunque evitala.
Important
Dichiarazione di funzione (o prototipo): il tipo di ritorno, i tipi dei parametri in ingresso ed il nome della funzione rappresentano il prototipo della funzione. Quando si fornisce il prototipo di una funzione si usa dire che si effettua la dichiarazione della funzione
Important
Definizione di funzione: quando si fornisce l'implementazione della funzione (il corpo: cioè le istruzioni contenute tra la coppia di graffe {
}
) allora si dice che la funzione è definita. La definizione implica anche la dichiarazione
Riprendendo la funzione differenza
usata precedentemente avremo rispettivamente: la definizione in basso
/* definizione della funzione differenza */
int differenza(int minuendo, int sottraendo){
return minuendo - sottraendo;
}
e la dichiarazione o prototipo di seguito:
int differenza(int, int); // prototipo della funzione differenza
volendo è possibile fornire anche i nomi dei parametri in ingresso ma nulla cambia ai fini della dichiarazione.
int differenza(int minuendo, int sottraendo); // prototipo della funzione differenza
Important
Il compilatore quando incontra una chiamata a funzione deve conoscerne almeno il prototipo per verificare che questa stia venendo usata correttamente (il corretto numero e tipo per i parametri di ingresso e che il valore di ritorno sia assegnato ad una variabile compatibile, dello stesso tipo).
La funzione main()
fa uso di un'altra funzione: printf()
che viene usata per stampare su schermo. Questa funzione è fornita (la sua implementazione) dal linguaggio C stesso, quindi non viene definita (non si fornisce l'implementazione nel nostro file). L'implementazione della printf()
sarà fornita sotto forma di file oggetto .o
che verrà assemblato dal linker con il nostro: hello.o
all'interno del file eseguibile finale. Il compilatore ha però bisogno di conoscere almeno il prototipo della funzione printf()
per verificarne l'uso corretto. Il prototipo della funzione printf()
è fornito all'interno del file stdio.h
; risulta necessario copiare il contenuto di questo file nel nostro esempio nelle righe precedenti a quella dove la funzione printf()
è usata. Non c'è bisogno di copiare ed incollare il file stdio.h
ma è possibile usare una direttiva del preprocessore #include
che sostuisce il contenuto del file stdio.h
a partire dalla riga di codice dove è inserita.
Per verificare l'effettiva aggiunta del prototipo di printf()
da parte del preprocessore puoi lanciare:
gcc -E 0_hello.c |grep 'printf'
questo l'output sulla mia macchina:
1 extern int fprintf (FILE *__restrict __stream,
2 extern int printf (const char *__restrict __format, ...);
3 extern int sprintf (char *__restrict __s,
4 extern int vfprintf (FILE *__restrict __s, const char *__restrict __format,
5 extern int vprintf (const char *__restrict __format, __gnuc_va_list __arg);
6 extern int vsprintf (char *__restrict __s, const char *__restrict __format,
7 extern int snprintf (char *__restrict __s, size_t __maxlen,
8 __attribute__ ((__nothrow__)) __attribute__ ((__format__ (__printf__, 3, 4)));
9 extern int vsnprintf (char *__restrict __s, size_t __maxlen,
10 __attribute__ ((__nothrow__)) __attribute__ ((__format__ (__printf__, 3, 0)));
11 extern int vdprintf (int __fd, const char *__restrict __fmt,
12 __attribute__ ((__format__ (__printf__, 2, 0)));
13 extern int dprintf (int __fd, const char *__restrict __fmt, ...)
14 __attribute__ ((__format__ (__printf__, 2, 3)));
15 printf("Hello World\n");
Alla riga 2 il prototipo di printf()
.
Infine, terminata la propria computazione il nostro programma ritora 0 per informare il sistema operativo che ha terminato senza errori.
Riassumendo:
- riga 14: inclusione del file d'intestazione
stdio.h
contente il prototipo della funzioneprintf()
. Il prototipo serve al compilatore per verificare che il programmatore utilizzi correttamente la funzione, in questo caso laprintf()
- riga 16-19: definizione della funzione
main()
Le funzioni sono un blocco di codice, un insieme di istruzioni che vengono raggruppate e possono essere richiamate in qualsiasi momento all'interno di un programma. Per intenderci, se nel nostro programma calcoliamo più volte la media pesata dei nostri voti è consigliabile racchiudere tutte le istruzioni all'interno di una funzione e richiamarla ogni volta che ne abbiamo bisogno piuttosto che riscrivere più volte lo stesso identico codice in punti diversi. Le funzioni possono ritornare un valore come risultato della loro elaborazione (possono anche non ritornare nulla al chiamante) e possono ricevere in ingresso un certo numero di parameti.
Una funzione ha un'intestazione ed un corpo, usando sempre la solita funzione differenza
vista in precedenza avremo:
int differenza(int minuendo, int sottraendo){
return minuendo - sottraendo;
}
la prima riga rappresenta l'intestazione della funzione (escluso la parentesi graffa), tutto il codice compreso da {
e }
è il corpo.
Come anticipato, quando viene fornita sia l'intestazione che il corpo (l'implementazione) si parla di definizione di funzione, se viene fornita solo l'intestazione (anche detta prototipo) si parla di dichiarazione di funzione.
Il prototipo della funzione sottrazione
è dunque il seguente:
int differenza(int minuendo, int sottraendo);
Volendo è possibile omettere il nome dei parametri in ingresso lasciando solo il tipo, in questo modo:
int differenza(int, int);
Per il compilatore non cambia nulla ma può aiutare un altro programmatore a comprendere il significato e l'uso dei parametri in ingresso.
Di sotto è riportato un esempio completo che fa uso della funzione sottrazione
, come è possibile vedere questa è richiamta all'interno del main()
alla riga 8 fornendo in ingresso i due parametri previsti durante le definzione. Se avessimo fornio un numero diverso (sia inferiore che superiore) di parametri o di tipo diverso rispetto al tipo intero il compilatore ci avrebbe dato errore (o forse nel secondo caso no...?!?)
#include<stdio.h>
int sottrazione(int, int);
int main(void){
int minuendo = 10;
int sottraendo = 3;
int risultato = sottrazione(minuendo, sottraendo);
printf("%d - %d = %d", minuendo, sottraendo, risultato);
}
int sottrazione(int minuendo, int sottraendo){
return minuendo - sottraendo;
}
Siccome la definzione della funzione sottrazione
è stata fornita successivamente (riga 12-14) al punto in cui questa è richiamata (riga 8) per permettere al compilatore di controllare il corretto uso da parte del programmatore è stato necessario fornire prima della riga 8 il prototipo della funzione (riga 3). Commentando la riga 3 il compilatore darebbe errore o almeno rileverebbe un warning circa una dichiarazione implicita che non è in grado di verificare.
Come spiegato ampiamente in precedenza, facciamo uso anche della funzione printf()
ed in questo caso per fornire il prototipo sfruttiamo la direttiva al preprocessore #inclde
Abbiamo precedentemente detto che una variabile è semplicemente una locazione di memoria a cui è associato un identificatore ed un tipo.
L'identificatore è un nome mnemonico che ci permette, all'interno del codice, di accedere al valore contenuto nella locazione di memoria corrispondente. Il tipo definisce lo spazio (in terminit di byte) che la locazione di memoria può contenere.
Una variabile prima di essere usata deve esssere sempre dichiarata. Come anticipato, l'operazione di dichiarazione consiste nell'allocare spazio di memoria per la variabile ed associargli l'identificatore; lo spazio riservato viene dedotto dal tipo della variabile.
I diversi tipi privisti del C hanno un numero di byte prefissati dipendenti dall'architettura; per esempio int
di solito occupa 32 o 64 bit, char
8 bit etc.
Se ti può aiutare puoi pensare ad una variabile come ad una scatola, vedi immagine di sotto.
int answer;
Una volta dichiarata la variabile è pronta ad ospitare un valore del tipo corrispondente a quello scelto nella dichiarazione; questa operazione è detta assegnamento
int answer; // dichiarazione di variabile, tipo intero
answer = 12; // assegnamento del valore 12 alla variabile sopra dichiarata
E' possible associare un valore ad una variabile direttamente nella dichiarazione, questa operazione è detta inizializzazione
int answer = 12; // dichiarazione con inizializzazione
E' possibile dichiarare più variabile nella stessa riga, purchè esse siano dello stesso tipo. In questo modo:
int question, answer;
Oltre al tipo ed all'identificatore una variabile è caratterizzata dalla visibilità (scope
in inglese) ed il tempo di vita (lifetime
o storage duration
)
Important
Visibilità: porzioni di codice nel programma in cui la variabile (il suo identificatore) è visibile e quindi è possibile fare riferimento alla variabile.
Important
Tempo di vita: porzione di tempo all'interno del ciclo di esecuzione del programma durante il quale alla variabile è associata una locazione di memoria
Sulla base del tempo di vita e della visibilità possiamo classificare le variabile in due grandi categorie: variabili globali e variabili locali.
Le variabili locali sono definite all'interno delle funzioni e hanno una visibilità limitata: dal punto in cui sono dichiarate fino al termine del corpo della funzione (ti ricordo che il corpo è compreso tra {
e }
); il loro tempo di vita è anche limitato: la locazione di memoria ad esse associata è allocata quando la funzione viene invocata ed è liberata quando l'esecuzione dell'intero corpo della funzione termina.
Le variabili globali sono definite fuori dalle funzioni, di solito dopo le direttive #include
nelle righe iniziali.
Hanno visibilità globale appunto, cioè sono visibili a tutte le funzioni nel file in cui sono dichiarate (e potenzialmente anche alle funzioni in altri file ma questo lo vedremo in seguito); il loro tempo di vita coincide con quello globale di esecuzione del programma.
Le variabili globali se non inizializzate vengono poste a zero automaticamente, al contrario le variabili locali se non inizializzate contengono semplicemente un valore sporco ed assolutamente non prevedibile (il valore che era precedentemente contenuto nella locazione di memoria che è stata associata alla variabile).
Il programma di sotto fa uso di variabili globali e locali; semplicemente sono definite tre funzioni: somma()
, differenza()
e moltiplicazione()
. I due operandi su cui le funzioni devono lavorare (primo
e secondo
) vengono definite coeme variabili globali; essendo globali queste variabili sono visibili da tutte le funzioni nel file.
int primo, secondo; /* variabili globali */
Il risultato dell'operazione ed il tipo di operazione da svolgere sono definiti come variabili locali (dentro la funzione main()
)
int risultato; // variabile locale
char operazione; // variabile locale
Queste due variabili sono visibili solo all'interno della funzione main()
dove sono dichiarate e non dalle altre funzioni.
Inoltre, siccome facciamo uso della funzione printf()
e scanf()
dobbiamo includere con la direttiva al preprocessore (#include
) i prototipi contenuti nel file header: stdio.h
.
Mentre printf()
serve per stampare a schermo il contenuto di una variabile, scanf()
viene usata per leggere un valore da tastiera e memorizzarlo in una variabile.
Le definizioni della funzioni somma()
, differenza()
e moltiplicazione()
sono fornite dopo la loro effettiva chiamata nel main()
e quindi per permettere al compilatore di controllare l'uso corretto di queste funzioni è stato necessario, prima del main()
, fornire i prototipoi.
#include <stdio.h>
int primo, secondo; /* variabili globali */
int somma();
int differenza();
int moltiplicazione();
int main(void){
int risultato; // variabile locale
char operazione; // variabile locale
printf("Inserisci il primo operando\n");
scanf("%d", &primo);
printf("Inserisci il secondo operando\n");
scanf("%d", &secondo);
printf("s)Somma d)Differenza m)Moltiplicazine\n");
scanf(" %c", &operazione);
if (operazione == 's'){
risultato = somma();
} else if(operazione == 'd') {
risultato = differenza();
} else if(operazione == 'm') {
risultato = moltiplicazione();
} else {
printf("Operazione non riconosciuta");
}
printf("Il risultato e': %d\n", risultato);
return 0;
}
int somma(){
return primo + secondo;
}
int differenza(){
return primo - secondo;
}
int moltiplicazione(){
return primo * secondo;
}
Inoltre nel codice incontriamo il primo costrutto per il controllo del flusso e precisamente if-else
.
Vedremo in dettaglio la loro sintassi più avanti, ora forniamo solo una breve spiegazione.
Il costrutto if
serve per realizzare l'istruzione di salto condizionale ed assume questa forma:
if (espr) istr
Se la condizione specificata dall'espressione espr
è vera (cioè diversa da zero) viene eseguito il blocco di istruzioni istr
alrimenti si prosegue con l'elaborazione
Il costrutto if
ammette l'enunciato opzionale else
. Il costrutto if-else
assume questa forma:
if (espr) istr1 else istr2
I blocchi di istrzioni istr1
e istr2
vengono eseguiti a seconda se l'espressione espr
sia vera o falsa. Se è vera si esegue espr1
se è falsa espr2
Nel nostro codice abbiamo qualcosa di un po' più complesso, analizziamolo assieme:
scanf(" %c", &operazione);
if (operazione == 's'){
risultato = somma();
} else if(operazione == 'd') {
risultato = differenza();
} else if(operazione == 'm') {
risultato = moltiplicazione();
} else {
printf("Operazione non riconosciuta");
}
La funzione scanf()
legge un carattere da tastiera ed inserisce il valore all'interno della variabile operazione
, il costrutto if-else
ci serve per eseguire la funzione corrispondente all'operazione richiesta dall'utente attraverso un carattere della tastiera.
Se operazione
contiene il carattere s
allora si eseguirà la funzione somma()
(solo quella e nessun'altra) altrimenti se il carattere è d
si esegue la funzione differenza()
e così via. Se il carattere contenuto in operazione
non è tra i tre attesi s
d
m
allora (ultimo else
) si stampa un messaggio che informa l'utente che l'operazione non è stata riconosciuta.
Tornando alle variabili possiamo riassumere quanto segue:
Variabili globali:
- visibili in tutto il file da ogni funzione
- se non inizializzate ad un valore sono settate a zero automaticamente
- il loro ciclo di vita coincide con quello del programma, la memoria è allocata prima dell'esecuzione e deallocata al termine dell'esecuzione
Variabili locali:
- visibili solo nel blocco dove sono state dichiarate
- se non inizializzate settate ad un valore assolutamente casuale
- il loro ciclo di vita è limitato all'esecuzione del blocco dove sono dichiarate
L'uso di variabili globali per comunicare con le funzioni è scorretto ed è stato mostrato solo come esempio per introdurre le variabili globali. Meno uso facciamo delle variabili globali e meglio è. Per comunicare con le funzioni e scambiare valori col chiamante è sempre preferibile usare i parametri in ingresso ed i valori di ritorno, quindi le variabili locali. Di sotto è riportato il codice corretto che elimina l'uso improprio delle variabili globali:
#include<stdio.h>
int somma(int, int);
int differenza(int, int);
int moltiplicazione(int, int);
int main(void){
int risultato = 0;
int primo, secondo;
char operazione;
printf("Inserisci il primo operando\n");
scanf("%d", &primo);
printf("Insesci il secondo operando\n");
scanf("%d", &secondo);
printf("s)Somma d)Differenza m)Moltiplicazione\n");
getchar();
operazione = getchar();
switch(operazione){
case 's':
risultato = somma(primo, secondo);
break;
case 'd':
risultato = differenza(primo, secondo);
break;
case 'm':
risultato = moltiplicazione(primo, secondo);
break;
default:
printf("Operazione non riconosciuta\n");
}
printf("Il risultato e': %d\n", risultato);
return 0;
}
int somma(int primo_addendo, int secondo_addendo){
return primo_addendo + secondo_addendo;
}
int differenza(int minuendo, int sottraendo){
return minuendo - sottraendo;
}
int moltiplicazione(int primo_fattore, int secondo_fattore){
return primo_fattore * secondo_fattore;
}
come puoi vedere le variabili primo
e secondo
sono state dichiarate dentro la funzione main()
e quindi sono locali (sono visibili solo all'interno di questa funzione), esattamente come risultato
ed operazione
. Solo risultato
è inizializzato a zero, le altre variabili conterranno all'inizio un valore casuale (le variabili locali non sono inizializzate automaticamente)
int risultato = 0;
int primo, secondo;
char operazione;
Conoscere la differenza tra variabili globali e locali è un buon punto di partenza, le cose sono però più complesse. Agli identificatori è associato uno scope (visibilità), alle variabili invece uno storage duration (tempo di vita) ed il linkage (collegamento).
Lo scope può essere di quattro tipi:
- block scope
- file scope
- function scope
- function prototype scope
Ricordiamo che lo scope di un identificatore è la regione di codice in cui l'identificatore è visibile (quindi la variabile accessibile da parte del programmatore).
Lo storage duration può essere di quattro tipi:
- static
- thread
- auto
- allocated
Ricordiamo che lo storage duration rappresenta il tempo di vita della variabile ovvero per quanto tempo questa rimane allocata in memoria
Il linkage può essere di tre tipi:
- no linkage
- internal
- external
Il linkage definisce se una variabile può essere condivisa dal codice dello stesso file o di file diversi.
Un blocco è un insieme di istruzioni comprese tra {
e }
.
Esempi di blocchi (alcuni li abbbimao già incontrati) sono:
-
il corpo nella definzione di una funzione
int differenza(int minuendo, int sottraendo){ }
-
il corpo nei costrutti di controllo del flusso
if-else
,for
,while
etcif(operazione == 's'){ risultato = somma(primo, secondo); } else { }
-
un blocco innestato:
for(int i=0; i<N; i++){ { int i = N; // questa i nasconde l'indice i del for } }
Una variabile all'interno di un blocco ha un block scope ed è quindi visibile (scope) dal punto in cui è definita fino alla fine del blocco che contiene la sua definizione. Le variabili locali sono di tipo block scope.
Important
I parametri formali di una funzione, anche se dichiarati fuori del corpo della funzione (dal blocco) appartengono al corpo e quindi hanno anch'essi un block scope
Note
Storicamente le variabili con block scope dovevano essere dichiarate all'inizio del blocco.
Dal C99 è possibile dichiarare le variabili all'interno del blocco in qualsiasi posizione al suo interno. Questo è utile soprattutto per le variabili indici di un loop o per documentare meglio il proprio codice dichiarando le variabili il più vicino possibile alla riga che fa uso effettivamente della stessa.
Una variabile definita al di fuori di qualsiasi funzione in un file .c
o .h
ha un file scope ed è visibile dal punto in cui è definita fino alla fine del file che la contiene.
Questo è il caso delle variabili globali che abbiamo trattato, esse infatti hanno un file scope.
#include<stdio.h>
int N = 100 /* N è globale: ha un file scope, è definita fuori da qualsiasi funzione, è visibile
* al main() ed alla funzione uno()
*/
int main(){
}
int uno(){
}
Il linkage definisce se una variabile è visibile in più file diversi o solo nel file in cui è definita.
Esistono tre tipi di linkage: no linkage
external
ed internal
.
Le variabili con un block scope (quelle locali) sono no linkage: cioè non sono visibili nell'intero file in cui sono definite ma la loro visibilità è limitata al blocco che le ospita.
Le variabili con un file scope (quelle globali) sono o external linkage o interanl: se external
la variabile può essere vista anche in altri file del programma.
Se internal
la variabile è visibile in tutto il file (quindi a tutte le funzione in esso definite) in cui è stata definita ma non in altri file del programma.
Le variabili globali hanno automaticamente un external linkage quindi potenzialmente possono essere visti in altri file sorgente del programma. Per restringere il linkage da external ad internal si usa la keyword static al momento della definizione della variabile, vediamo un esempio
int globale_esterna = 10; /* variabile globale, file scope, external linkage.
* E' visibile all'interno del file sorgente corrente e potenzialmente
* anche in tutti gli altri sorgenti del programma
*/
int static globale_interna = 100; /* variabile globale, file scope, internal linkage in quanto usa
* keyword static. E' visibile solo all'interno del file sorgente
* corrente
*/
int main(void) {
}
E' buona norma, soprattutto se il tuo programma ha grosse dimensioni in termini di file, dichiarare static le tue variabili globali se queste servono solo all'interno del file corrente. Questo previene il problema di uno spazio di nomi globale pieno di identificatori già utilizzati.
Caution
La parola chiave static non ha nulla a che vedere con lo storage duration di tipo static. Tutte le variabili globali (sia di tipo external che internal linkage) hanno uno storage durantion di tipo static cioè esistono in memoria per tutto il tempo di esecuzione del programma.
Esistono quattro tipi diversi di storage duration: static
thread
auto
allocated
.
Per il momento affrontiamo solamente i tipi: static
ed auto
.
Variabili che esistono in memoria per l'intero tempo di esecuzione del programma: sono le variabili con file scope (variabili globali sia di tipo external
che internal
linkage)
int file_scope_extenal_linkage; /* variabile globale con file scope ed external linkage */
static int file_scope_internal_linkage; /* variabile globale con file scope ma internal linkage:
* è usata la keyword static che limita la visibilità al
* solo file corrente
*/
int main(void){
}
Variabili che hanno un tempo di vita limitato che non coincide che il tempo di esecuzione del programma: sono le variabili con block scope che vengono allocate quando il programma entra nel blocco in quale queste sono definite e poi deallocate quando si esce dal blocco.
Important
E' possibile per una variabile con block scope avere uno storage duration non auto ma static. Per farlo basta dichiarare la variabile all'interno del blocco usando la keyword static come mostrato sotto:
int main(void){
uno();
}
int uno(void){
static int variabile_statica = 0; /* variabile statica anche se dichiarata all' interno di
* un blocco (dovrebbe essere di tipo auto senza la paro
* -la chiave static).
* La memoria per la variabile è allocata all' inizio
* del programma e deallocata al termine del programma.
* Se fosse rimasta auto la memoria sarebbe stata alloca
* ta solo all' entrata del flusso nella funzione e ri
* -mossa all'uscita
*/
}
Scope, linkage e storage duration sono combinati assieme per definire le classi di memorizzazione
Class | Storage Duration | Scope | Linkage | Come dichiarare |
---|---|---|---|---|
automatic | Automatic | Block | No linkage | Dentro un blocco |
register | Automatic | Block | No linkage | Dentro un blocco con keyword register |
static external linkage | Static | File | External | Fuori dalle funzioni |
static internal linkage | Static | File | Internal | Fuori dalle funzione con keyword static |
static no linkagge | Static | Block | No linkage | Dentro un blocco con keyword static |
Una variabile appartenente alla classe di memorizzazione automatica (auto
) ha:
- automatic storage duration
- block scope
- no linkage
Qualsiasi variabile dichiarata all'interno di un blocco ({
e }
) è di tipo auto
, in pratica è la classe di memorizzazione per tutte le variabili locali.
Le variabili di classe auto
non sono inizializzata automaticamente, questo è il motivo per cui le variabili locali devono essere inizializzate esplicitamente altrimenti ospitano un valore assolutamente casuale, sporco.
int main(void){
int a; /* variabile di classe auto: il suo storage duration è limitato all'esecuzione del blocco
* cioè viene allocata quando il flusso di esecuzione entra nel blocco e deallocata quando
* si esce dal blocco; quindi quando si esce dal blocco il valore in essa contenuto viene
* perso,quando si rientrerà nel blocco la volta successiva verrà allocato nuovo spazio in
* memoria completamente diverso rispetto a quello precedente.
* Lo scope è limitato al blocco: cioè il suo identificatore è visibile solo all'interno
* del blocco e in ultimo non ha linkage in quanto ovviamente non è visibile alle funzioni
* nel file corrente e nei restanti file del programma.
* Inoltre la variabile non è inizializzata ad alcuno valore, non possiamo prevedere quale
* sia il valore iniziale che troveremo al suo interno.
* /
}
E' possibile dichiarare la variabile usando esplicitamente la parola chiave `auto` anche se `auto` per le variabili dichiarate dentro un blocco è il default. Di solito questo ha senso quando all'interno del blocco si sta offuscando una variabile esterna e si vuole esplicitare questo evento avvertendo chi legge il codice di questo o per specificare che non si vuole che si cambi la classe di memorizzazione per quella variabile. Sotto un esempio:
int a; /* variabile esterna visibile da tutte le funzioni, compreso il main() */
int main(void){
auto int a; /* la dichiarazine di una variabile automatica di nome a nel main() determina
* l'offuscamento (uscita di scope) della variabile esterna con lo stesso nome.
* Per informare chi legge il codice di fare attenzione a questo evento si può
* esplicitare la classe di memorizzazione auto nella dichiarazione
*/
}
Ricordati quindi che all'uscita del blocco il valore contenuto nella variabile viene perso perchè viene deallocata e non puoi accederci perchè fuori dal blocco l'identificatore non è visibile.
Le variabili register
sono della variabili di tipo auto
(block scope, no linkage, automatic storage duration) solamente che dichiarandole in questo modo il programmatore richiede al compilatore di memorizzarle nella memoria più veloce a disposizione che appunto dovrebbero essere i registri della cpu e non la ram.
Questa è una richiesta che può anche non essere esaudita del compilatore se i registri sono occupati o la dimensione del dato è troppo grando rispetto alla capacità dei registri della cpu. Si dichiarano register
le variabili che devono essere accedute spesso e con grande velocità: ad esempio gli indici dei cicli. L'uso di variabili register
ha perso la sua importanza in quanto i moderni compilatori sono in grado di effettuare queste considerazioni per l'ottimizzazione del codice da soli anche se usare variabili `register` potrebbe aiutare a capire quali variabili ricihedono velocità di accesso.
Da ricordare è che una volta che una variabili è dichiarata register
non è possbile recuperare l'indirizzo della variabile. Si possono dichiarare di classe register
anche i parametri formali delle funzioni.
int main(void){
register int a; /* variabile register, non è possibile fare &a ERRORE */
}
int uno(register int a);
Una variabile con block scope ha visibilità limitata all'interno del blocco in cui è dichiarata ed ovviamente nessun linkage (non è visibile alle altre funzione nel file corrente e negli altri file). Lo storage duration è limitato al tempo di esecuzione del blocco in cui è dichiarata; la variabile è allocata in memoria appena si entra nel blocco e deallocata all'uscita. Queste variabili sono le variaili locali. Rendere statica una variabile locale significa modificare il suo storage duration che coinciderà con il tempo di esecuzione del programma e non più con il tempo di esecuzione del blocco; in altre parole la variabile sarà allocata quando il programma verrà eseguito e deallocata alla sua terminazione. Ovviamente lo scope resta di tipo block quindi anche se la variabile non viene deallocata all'uscita del blocco il suo identificatore non è più visibile e quindi non è possibile accedere alla locazione di memoria. Quando il flusso di esecuzione rientrerà nel blocco il valore precedetemente conservato sarà disponibile attraverso l'identificatore. Per dichiarare statica una variabile locale si usa la keyword static, vediamo un esempio:
La funzione example_static_var
dichiara due variabili: a
di tipo automatica e b
statica (con block scope). Vediamo le differenze pratiche:
#include<stdio.h>
void example_static_var(void);
int main(void){
/* Richiamiamo cinque volte la funzione example_static_var: la variabile a ad ogni
* nouva chiamata verrà prima allocata poi inizializzata a zero, incrementata di 1
* e poi deallocata. una successiva chiamata alla funzione example_static_var rial
* -locherà spazio in memoria per la variabile e la inizializzerà a 0 e così via.
* Al massimo la variabile a potrà valere 1. Al contrario la variabile di nome b
* viene allocata una sola volta all' esecuzione e deallocata alla terminazione,
* quindi il suo valore sarà conservato tra due chiamate successive alla funzione
* example_static_var, il valore di b infatti sarà incrementato cinque volta pari
* al numero di chiamate della funzione example_static_var
example_static_var();
example_static_var();
example_static_var();
example_static_var();
example_static_var();
}
void example_static_var(void){
int a = 0; /* variabile automatica: viene allocata all' entrata del blocco e
* deallocata all' uscita perdendo il valore in esso contenuto
*/
static int b; /* variabile locale statica: viene allocata una sola volta all'
* esecuzione del programma e deallocata alla terminazione, mantie
* -ne il valore in essa contenuto anche se si esce dal blocco
* Non abbiamo inizializzato la variabile esplicitamente a zero
* in quanto è statica: le variabili statiche non inizializzate
* esplicitamente sono poste a zero dal compilatore.
*/
a = a + 1; // a ora vale 1
b = b + 1; // b ora vale b + 1, il valore di b dipende da quante volte la
// funzione è stata richiamata nel programma fino a questo momento
printf("a=%d, b=%d\n", a, b);
}
Come puoi vedere dall'output del programma compilato
vagrant@ubuntu2204:~$ ./static_variable
a=1, b=1
a=1, b=2
a=1, b=3
a=1, b=4
a=1, b=5
Infine, i parametri formali di una funzione non posso essere dichiarati static, non puoi fare questo:
int no_possible_static_parameter(static int a); /* ERRORE */
Fino a questo punto abbiamo usato i termini dichiarazione e definizione in modo intercambiabile come se fossero la stessa cosa. In realtà esiste una differenza ed è arrivato il momento di affrontarla.
La definizione di una variabile coincide con l'istruzione per cui avviene l'allocazione di spazio in memoria per la variabile. La dichiarazione invece consiste nel dichiarare al compilatore che si farà uso di una variabile già allocata nel file corrente o in un altro file.
Per le variabili locali (auto
) la definizione coincide con la dichiarazione, per le variabili globali ha senso conoscere questa leggera differenza.
Una variabile globale ha file scope ed external linkage, per questo viene anche detta variabile esterna (visibile anche all'esterno del file, negli altri file del programma).
Ricordiamo che una variabile esterna (globale) è DEFINITA fuori dalle funzioni all'inizio del file, in questo modo:
#include<stdio.h>
int extern_global_var; /* variabile globale, è esterna ( external linkage, visibile agli altri
* file ) inizializzata a zero dal compilatore perchè statica ( static
* storage duration) questa è una DEFINIONE, questa istruzione determina
* l'allocazione di spazio in memoria per la variabile. La variabile può
* essere vista anche dagli altri file del programma.
*/
extern int global_var_somewhere_in_other_file; /* questa è una DICHIARAZIONE di variabile ester
* na che è stata DEFINITA in qualche altro file
* per renderla visibile anche in questo file è
* OBBLIGATORIA la dichiazione attraverso la key
* -word extern
*/
int main(void){
extern int extern_global_var; /* questa è una DICHIARAZIONE opzionale, NON OBBLIGATORIA
* basta usare la keyword extern.Serve esclusivamente per
* documentare che nella funzione verrà usata una variabi
* le globale (non locale automatica)e di stare attenti a
* come questa viene va lorizzata e manipolata in quanto
* ha visibilità in tutto il file e potenzialmente in tut
* -ti i file
*/
}
E' possibile dopo aver DEFINITO la variabile esterna, a scopo di documentazione, DICHIARARLA all'interno delle funzioni che la useranno attraverso le keyword extern
come fatto sopra nel main()
.
Infine per rendere visibile in un file una variabile esterna (globale) che è stata DEFINITA in un altro file è OBBLIGATORIA la DICHIARAZIONE con keyword extern
nel secondo file come è stato fatto sopra per la variabile global_var_somewhere_in_other_file
Caution
Se togliessimo la keyword extern
nella DICHIARAZIONE della variabile global_var_somewhere_in_other_file
questa si traformerebbe in una DEFINIZIONE
di nuova variabile e causerebbe un errore in quanto (in qualche altro file) già esiste una variabile globale esterna con queste nome ed ovviamente non
possono esistere due variabili (due locazione di memoria diverse) con lo stesso nome nel medesimo spazio di nomi.
#include<stdio.h>
int extern_global_var; /* DEFINZIONE di variabile esterna (globale)
int global_var_somewhere_in_other_file; /* togliendo la keyword extern questa non è più una DICHIA
* RAZIONE di variabile esterna definita in un altro file
* ma una DEFINIZIONE di nuova variabile esterna,una varia
* -bile esterna con lo stessso nome già esiste ed il com-
* pilatore tornerà errore.
*/
int main(void){
extern int extern_global_var; /* DICHIARAZIONE opzionale della variabile esterna DEFINITA
* sopra
*/
}
Le variabili globali sono DEFINITE all'esterno delle funzioni, di solito all'inizio del file sorgente dopo le direttive al preprocessore (#include
). Come anticipato queste variabili hanno: file scope (sono visibili a tutte le funzioni del file che contiene la loro definizione) static storage duration (tempo di vita in memoria coincidente con l'esecuzione del programma) ed external linkage (sono potenzialmente visibili anche in tutti i file sorgente del programma). Quindi le variabili globali sono variabili statiche con external linkage. Nella definizione non si usa la keyword extern
, invece questa può essere usata (opzionale) nella dichiarazione della variabile all'interno delle funzioni che la useranno, l'uso di extern
è invece obbligatorio quando si vuole usare una variabile globale definita in un altro file del programma, in questo caso è necessario dichiarare (nel file che vuole usare la variabile definita in altro file) esplicitamente la variabile usando la keyword extern
. In soldoni extern
non viene usata nella DEFINIZIONE (quando si crea per la prima volta la variabile globale e viene allocata la memoria) bensì è usata nelle DICHIARAZIONI per informare il compilatore che la variabile è definita da qualche altra parte e nel file si vuole solo fare uso della varabile esterna già allocata.
Infine è importante ricordare che le variabili esterne possono essere inizializzate solo una volta e nella DEFINIZIONE, inizializzare una variabile esterna nella DICHIARAZIONE è un ERRORE:
// file uno.c
int esterna = 10; /* DEFINIZIONE CON INIZIALIZZAZIONE ESPLICITA, OK */
// file due.c
extern int esterna = 2; // DICHIARAZIONE ERRORE
Alla luce di queste nuove conocsenze modifichiamo il programma visto in 3_variabili.c
spostando i prototipi della funzioni e la DEFINIZIONE delle variabili globali in un file header
(estensione .h
). Abbiamo già incontrato questi file quando abbiamo introdotto la funzione printf()
ed avevamo detto che era necessario includere il file header stdio.h
che conteneva il prototipo della printf()
. I file header o d'intestazione contengono sia i prototipi delle funzioni sia le strutture dati (quindi anche le variabili globali) che saranno utili nel corrispondente file sorgeten (estensione .c
).
I file d'intestazione possono essere sia di sistema (cioè forniti dal linguaggio stesso) e vengono inclusi nella direttiva #include
usando le parentesi angolari <
>
, in questo modo:
#include <stdio.h>
i file d'instestazione definiti dal programmatore vengono inclusi usando i doppi apici "
in questo modo:
#include "4_varibili.h"
Il nostro compito è allora spostare tutti i prototipi e le variabili globali di 3_variabili.c
in un file d'instazione (4_variabili.h
) ed includere il file header nel corrispondente file sorgente (4_variabili.c
).
Ovviamente fare qualche piccola modifica e miglioramente al programma precedente, nello specifico:
-
Nel file
4_variabili.h
oltre che dichiarare i prototipi della funzioni, definiamo una nuova variabile esterna (costante)NUM_ITERATIONS
che rappresenta il numero di volte che il programma richiederà all'utente di eseguire un'operazione prima di terminare autonomamente.
const int NUM_ITERATIONS = 2;
-
Per iterare più volte il processo di calcolo (richiesta di inserimento operandi ed operazione) usiamo un nouvo costrutto di controllo del flusso: il
for
. Anche questo verrà trattato in dettaglio in un altro paragrafo ma brevemente possiamo anticipare che il costruttofor
serve per realizzare un clico (o loop), permette di eseguire un insieme di istruzioni per un certo numero di volte. Ha questa forma:for ( espr1 ; espr2 ; espr3 ) istr
. Prima di iniziare il ciclo viene valutata una volta solaespr1
che viene tipicamente usata per inizalizzare le variabili che controllano il ciclo (dette indici del ciclo). Poi viene valutata l'espressioneespr2
che, se vera, determina l'esecuzione del corpo del ciclo costituito dal blocco di istruzioniistr
, in caso contrario (espr2
è falsa) il ciclo termina. Prima di valutare nuovamente (passo successivo)espr2
, viene valutata l'espressioneespr3
che tipicamente viene usata per incrementare o decrementare la variabile (indice) che controlla il ciclo (inespr2
).
Ecco un sempio di un ciclo che stampa i numeri da 0 a 9:
#include <stdio.h>
int main(void){
/* i è la variabile indice del ciclo, viene inizializzata a zero in espr1
* se espr2 è vera:cioè se i < 0 si esegue il blocco (funzione printf() )
* al termine delle istruzioni del blocco (comprese tra { e } ) si esegue
* espr3 (i++) cioè si incrementa di uno la variabile indice i. Ii ciclo
* terminerà quando i = 10 cioè quando espr2 sarà falsa
*/
for (int i=0; i<10; i++){
printf("%d\n", i);
}
}
Quando il blocco del ciclo è composto da una sola istruzione è possibile omettere la coppia di parentesi graffe ({
}
) come nel nostro caso e riscrivere il ciclo in questo modo:
for (int i=0; i<10; i++)
printf("%d", i);
- Aggiungiamo l'operazione di divisione che mancava nella versione precedente
Il codice del fle header 4_variabili.h
e sorgente 4_variabili.c
è mostrato di sotto, la cosa da far notare è la variabile esterna NUM_ITERATIONS
che è DICHIARATA nel .h`
, questo verrà include nel .c
dal prepocessore quindi sarà poi effettivamente parte del file .i
ma per esplicitare che si sta usando una variabile DEFINITA in un altro file, nel .c
si effettua una DICHIARAZIONE della variabile usando la keyword extern
.
const int NUM_ITERATIONS = 2;
int somma(int, int);
int differenza(int, int);
int moltiplicazione(int, int);
int divisione(int, int);
#include <stdio.h>
#include "4_variabili.h"
extern const int NUM_ITERATIONS;
int main(void){
int risultato = 0;
int primo, secondo;
char operazione;
for(int i = 0; i < NUM_ITERATIONS; i++){
printf("Inserisci il primo operando\n");
scanf("%d", &primo);
printf("Inserisci il secondo operando\n");
scanf("%d", &secondo);
printf("s)Somma d)Differenza m)Moltiplicazione D)Divisione\n");
scanf(" %c", &operazione);
switch(operazione){
case 's':
risultato = somma(primo, secondo);
break;
case 'd':
risultato = differenza(primo, secondo);
break;
case 'm':
risultato = moltiplicazione(primo, secondo);
break;
case 'D':
risultato = divisione(primo, secondo);
break;
default:
printf("Operazione non riconosciuta\n");
}
printf("Il risultato e': %d\n", risultato);
}
}
int somma(int primo_operando, int secondo_operando){
return primo_operando + secondo_operando;
}
int differenza(int minuendo, int sottraendo){
return minuendo - sottraendo;
}
int moltiplicazione(int primo_fattore, int secondo_fattore){
return primo_fattore * secondo_fattore;
}
int divisione(int dividendo, int divisore){
return dividendo / divisore;
}
Queste variabili sono globali ed hanno file scope, static storage duration ma internal linkage: questo vuol dire che la loro visibilità è limitata al file che le contiene. La loro DEFINIZIONE è: come tutte le variabili globali effettuata fuori da tutte le funzioni di solito all'inizio del file con l'aggiunta della parola chiave static.ù
int global_external; /* DEFINIZIONE di variabile globale esterna, visibile nel file ed in tutti gli altri file del programma */
static int global_internal; /* DEFINIZIONE di variabile globale interna, non è visibile agli altri file del programma */
int main(void){
extern int global_external; /* DICHIARAZIONE opzionale di variabile globale esterna */
extern int global_internal; /* DICHIARAZIONE opzionale di variabile globale interna */
}
Una dichiarazine di variabili ha questa forma:
specificatori-dichiarazione dichiaratori
Gli specificatori di dichiarazione descrivono le proprietà della variabile o della funzione oggetto della dichiarazione. Gli specificatori di dichiarazione sono raggruppabili in tre categorie:
- classi di memorizzazione (storage classes): sono quattro
auto
,static
,extern
eregister
. Al massimo una di queste può presentarsi in una dichiarazione e se presente deve essere la prima keyword nella dichiarazione - qualificarori di tipo (type qualifiers): sono tre
const
,volatile
erestrict
. Una dichiarazione puà contenere zero, uno o più di un qualificatori di tipo - specificatori di tipo (type specifiers):
void
char
short
int
long
float
double
signed
unsigned
. Queste keyword possono essere combinate assieme (`unsigned long int``) l'ordine con cui compaiono non ha importanza
Vediamo alcuni esempi:
+--------------classe di memorizzazione
|
static float x, y, *p;
| | | |
| +---+---+---dichiaratori
|
+---specificatore di tipo
+---qualificatore di tipo
|
| +----dichiaratore
| |
const char month[] = "July";
| |
| +----inizializzatore
|
+----specificatore di tipo
+--classe di memorizzazione
|
| +-------+---+-------specificatori di tipo
| | | |
extern const unsigned long int a[10];
| |
| +-----dichiaratore
+ qualificatore di tipo
La definizione (e dichiarazione) di funzione, come per le variabili, può contenere una classe di memorizzazione. Per le funzioni abbiamo solo due classi di memorizzazione: extern
e static
. La keyword extern
all'inizio della dichiarazione o definizione di funzioni specifica che la questa ha external linkage: può essere chiamata da funzioni in altri file del programma. La parola chiave static
invece indica internal linkage e quindi limita l'uso della funzione all'interno del file in cui è definita. Se non viene specificata una classe di memorizzazione per la funzione questa assume la classe extern
.
extern int f(int i);
static int g(int i);
int h(int i); /* default extern */
int a;
extern int b;
static int c;
void f(int d, register int e){
auto int g;
int h;
static int i;
extern int j;
register int k;
}
Name | Storage Duration | Scope | Linkage |
---|---|---|---|
a | static | file | external |
b | static | file | Nota |
c | static | file | internal |
d | automatic | block | none |
e | automatic | block | none |
g | automatic | block | none |
h | automatic | block | none |
i | static | block | none |
j | static | block | Nota |
k | automatic | block | none |
Nota: La definizione di b
e di j
non sono mostrate quindi non è possibile determinare il linkage di queste variabili. Nella maggior parte dei casi le variabili saranno definite in un altro file ed avranno quindi external linkage
La capacità di separare l'implementazione delle funzioni dai loro prototipi attraverso l'uso dei file header e la possibilità di poter condividere variabili tra file diversi del programma ci permettono ora di fare un uleriore passo nel miglioamento della nostra calcolatrice. Vogliamo riorganizzare il codice in modo da ottenere dei moduli separati, ora vedremo cosa significa e quali sono i vantaggi nel fare ciò. Pensare di realizzare programmi di grandi dimensioni usando un unico grande file sorgente è una cattiva idea per tante ragioni, le principali sono:
- una modifica anche piccola al codice richiede la ricompilazione dell'intero file sorgente che essendo molto esteso può richiedere tanto tempo
- in un unico file sorgente può risultare difficile trovare la porzione di codice su cui dobbiamo lavorare o da correggere, al contrario usando un approccio modulare la ricerca di una certa funzionalità richiede di analizzare solo il file sorgente e d'intestazione corrispondente
- non è possibile fare information hiding rendendo nascosti i dettagli alle porzioni di codice che non hanno alcun ruolo in un certo compito
Vantaggi di un approccio modulare sono:
- in progetti di grosse dimensioni, i programmatori possono lavorare su moduli diversi
- i moduli di un programma possono essere riutilizzati in altri progetti
- ogni modulo contiene il codice relativo ad una singola funzionalità isolando al suo interno tutto il codice necessario
Abbiamo già detto che i file che compongono un programma sono:
- file sorgenti: (source files) con estensione
.c
- file d'intestazione (header files) con estensione
.h
Di solito si raggruppano tutte le funzioni ed i dati relativi ad una certa funzionalità in un unico file sorgente (.c
) e si crea un corrispondente file header .h
(con lo stesso nome del file sorgente a cui si riferisce ma con ovviamente estensione diversa) che contiene i prototipi delle funzioni (implementate nel file sorgente) e la definizione dei tipi di dato usati dal modulo (se è richiesto).
Caution
Nei file header .h
devono essere inseriti solo le definizioni dei tipi ed i prototipi (le dichiarazioni) della funzioni. L'implementazione delle funzioni risiede nel file sorgente .c
Brevemete, il 5_variabili_main.c
inseriamo la logica di interazione con l'utente, l'implementazione delle funzioni matematiche viene spostata in un file sorgnete separato: 5_variabili.c
ed i prototipi nel corrispondente file header 5_variabili.h
Note
Il file sorgente che contiene le funzioni matematiche ed il suo corrispettivo file d'intestazione hanno stesso nome ma estensioni differenti: 5_variabili.c
e 5_variabili.h
Nel file 5_varibili_main.c
facciamo uso delle funzioni matematiche quindi prima del loro utilizzo all'interno dello switch
importiamo il file header contenente i prototipi, ovvviamente facciamo lo stesso anche per la funzione printf()
.
Warning
Fai attenzione che per includere il file header per la funzione printf()
si usano le parentesi angolari <
>
in quanto si tratta di funzioni del linguaggio, per includere file d'intestazioni definite dal programmatore si usano i doppi apici "
#include <stdio.h> // header della libreria c
#include "5_variabili.h" // header definito dal programmatore
In aggiunta, sostituaimo il costrutto if-else
con lo switch
. Lo switch
è assolutamente equivalente ad un if-esle
e serve a scegliere tra diversi blocchi di istruzioni in base al valore di una espressione intera. La sintassi è la seguente:
switch ( espressione-intera ) {
case espressione-costante :
[ istr ]
[ ... ]
[ break ; ]
case espressine-costante :
[ istr ]
[ ... ]
[ break ; ]
[ default: ]
[ istr ]
[ ... ]
[ break ; ]
}
Il preprocessore elabora il contenuto di un file sorgente prima della compilazione ed opera delle sostituzioni di testo: la sostituzione di parti del codice sorgente originale con altro testo. Il preprocessamento è il primo step del processo che porta alla generazione del file eseguibile. Il preprocessore può svolgere differenti sostituzioni, tutte le chiamate al preprocessore sono dette direttive al preprocessore, le più famose sono:
#define
#include
#if
#ifdef
Important
Tutte le righe nel codice che iniziano con il carattere #
sono direttive al preprocessore
Queste direttiva permettono di:
- includere il cotenuto di altri file all'interno del sorgente
- ridefinire il significato degli identificatori
- disabilitare condizionalmente parti di codice in fase di compilazione eliminando il testo prima che il compilatore lo elabori
Tip
E' il preprocessore che elimina tutti i commneti presenti nel codice sorgente in modo che sia compilatore solo il codice vero e proprio
La direttiva #define
viene usata per creare le macro. Le macro sono utilizzate per effettuare sostituzioni tipografiche nel codice sorgente prima della compilazione.
Ha questa forma:
#define nome nuovo-nome
A seguito della riga sopra, tutte le successiva occorrenze dell'identificatore nome
presenti nel codice saranno sostituite con nuovo-nome
(non viene considerato lo spazio tra nome
e nuovo-nome
).
Il testo da sostituire può estendersi su più di una riga se l'ultimo carattere della linea è \
che fa ignorare il carattere di nuova riga \n
al preprocessore.
Ecco alcuni esempi di uso di #define
:
#define NUM_ITERATIONS 10
for(int i=0; i < NUM_ITERATIONS; i++)
printf("%d\n", i);
#define DIM_BUFFER 100
int array[DIM_BUFFER];
Le macro possono ricevere parametri in ingresso, vengono realizzate per realizzare piccole pseudo-funzioni:
#define QUADRATO(x) x*x
int main(void){
int lunghezza_lato = 10;
int area_quadrato = QUADRATO(lunghezza_lato);
}
La macro QUADRATO
determina la sostituzione del testo QUADRATO(lunghezza_lato)
col testo lunghezza_lato*lunghezza_lato
prima della compilazione, quindi il codice visto dal compilatore è:
int main(void){
int lunghezza_lato = 10;
int area_quadrato = lunghezza_lato*lunghezza_lato;
}
Si usa dire che la macro è stata espansa. Le macro sono molto più veloci delle funzioni ma usandole è più facile inserire nel codice errori difficilmente identificabili. Inoltre i moderni compilatori sono in grado di effetturare ottimizzazioni sul codice e capire autonomamente quando evitare una chiamata a funzione espondedo il codice in essa contenuta. In generale quindi l'uso eccessivo di macro o l'utilizzo di macro complesse non porta a miglioramenti delle prestazioni ma può comportare l'insorgere di bug difficili da risolvere. Vediamo un esempio:
#define QUADRATO(x) x*x
int main(void){
int area_quadrato = QUADRATO(1+2);
}
Il codice di sopra viene in espanso in questo modo:
#define QUADRATO(x) x*x
int main(void){
int area_quadrato = 1+2*1+2;
}
Per evitare errori sarebbe stato giusto definire la macro in questo modo:
#define QUADRATO(x) ((x)*(x))
Caution
L'uso di macro con parametri senza l'uso di parentesi tonde porta ad errori difficili da identificare
Abbiamo accennata a questa direttiva nei paragrafi introduttivi spiegando che serviva per includere il file header stdio.h
che conteneva il prototipo della funzione printf()
.
La direttiva #include
sostituisce il contenuto di un intero file nella riga di codice dove è inserita.
Esiste in due forme: con parentesi angolari o con doppi apici:
#include <stdio.h>
#include "file.h"
La prima forma (parentesi angoli <
>
) è usata per includere il contenuto di file d'intestazione del linguaggio, la seconda forma invece permette di includere i file header definiti dal programmatore.
Con queste direttive si possono escludere porzioni di codice in base al verificarsi o meno di certe condizioni
La direttiva #if
valuta un'espressione intera costante il cui valore deve essere noto all'atto della compilazione.
#if espressione-intera-costante
/*
* questo codice viene compilato solo se
* l'espressione risulta (vera) diversa da 0
*
* #endif termina la sezione condizionale
*/
#endif
Tutte le righe comprese tra #if
e #endif
vengono incluse nel file header solo se l'espressione è diversa da 0 altrimenti vengono rimosse.
La direttiva #ifdef
è molto simile, non valuta un'espressione costante ma la definizione o meno di una macro; vedi codice sottostoante:
#ifdef macro
/*
* questo codice viene considerato
* solo se macro è già stata definita
*/
#endif
#ifdef
include il codice tra se stessa e la direttiva #endif
solo se la macro è definita.
E' possibile ottenere il comportamento opposto con #ifndef
, come segue:
#ifndef macro
/*
* questo codice viene considerato
* solo se macro non è stata definita
*/
Important
La definizione del simbolo macro deve essere effettuata con la direttiva #define
In fase di debugging può essere utile eliminare temporaneamente porzioni di codice senza cancellarle, oppure al contrario far eseguire certi pezzi di codice (printf()
di variabili per valutarne il valore) solo in fase di debug/testing. A questi scopi possiamo usare le direttive mostrate sopra, vediamo come:
#if 0
/* pezzzo di codice da non considerare */
#endif
Una volta eliminati i problemi si può rispristinare il codice cambiando rimuovedo le righe contenenti #if
#endif
oppure cambiando il valore zero con il valore uno come mostrato sotto:
#if 1
/* codice ripristinato */
#endif
oppure più elgantemente usando #define
e #if
assieme:
#define SWITCH 0
#if SWITCH
/*
* Se l'interruttore è chiuso (SWITCH 0) il codice non è considerato
* Se l'interruttore è aperto (SWITCH 1) il codice è considerato
*/
#endif
Si può ottenere lo stesso risultato con la direttiva #ifdef
in questo modo:
#ifdef UNDEF
/* pezzo di codice non è incluso perchè UNDEF non è definita */
#endif
Questa seconda soluzione, più elegante, può essere utilizzata anche per includere dei pezzi di codice in fase di testing/debugging (per esempio uan serie di stampe su schermo dei valori della variabili). Per farlo basta definire una macro DEBUG
con la direttiva #define
ed usare #ifdef
o #ifndef
per includere il codice di test in questo modo:
#define DEBUG
#ifdef DEBUG
/*
* questo codice viene considerato perchè DEBUG
* è definito, per escludere questo codice devi
* usare la direttiva #undef o eliminare la dire-
* ttiva '#define DEGUB'
* /
#endif
Per non considerare il codice basta rimuovere la prima riga #define DEBUG
ma, per rendere esplicito che DEBUG è usato per una compilazione condizionale del codice attraverso il preprocessore e che questo è stato disattivato, è meglio usare la direttiva #undef
in questo modo:
#undef DEBUG
#ifdef DEBUG
/*
* questo codice non viene considerato
* perchè DEBUG non è definito
* /
#endif
Ovviamente con #ifndef
otteniamo il comportamento opposto, vediamo un esempio che usa #ifdef
e #ifndef
per includere e/o escludere porzioni di codice a seconda se è attivato il DEBUG o meno:
#undef DEBUG /* We are in production */
#ifdef DEBUG
printf("Staging code, debugging is enabled");
#endif
#ifndef DEBUG
printf("Production code, no debugging enabled");
#endif
Esiste anche la possibilità di usare #else
in questo modo:
#define DEBUG /* We are in staging */
#ifdef DEBUG
printf("Staging code, debugging is enabled");
#else
printf("Production code, no debugging enabled");
#endif
Esiste anche la possibilità di usare #if
#elif
#else
per condizioni più complesse:
#include<stdio.h>
int main(void){
#ifdef IA32
#define CPU_FILE "ia32.h"
#elif MAC_OS
#define CPU_FILE "arm.h"
#else
#define CPU_FILE "amd64.h"
#endif
printf("CPU_FILE = %s\n", CPU_FILE);
return 0;
}
vagrant@ubuntu2204:~$ gcc -DMAC_OS -o test test.c
vagrant@ubuntu2204:~$ ./test
CPU_FILE = arm.h
La cosa interessante di questo approccio è il fatto che è possibile definire simboli passando direttamente un opzione al compilatore, se ho ad esempio il file conditional_compilation.c
con questo contenuto:
#include<stdio.h>
int main(void){
#ifdef DEBUG
printf("Staging code, debugging is enabled");
#else
printf("Production code, no debugging enabled");
#endif
return 0;
}
Posso definire il simbolo DEBUG
da riga di comando a tempo di compilazione passando a gcc
l'opzione -D
in questo modo:
gcc -DDEBUG -o conditional_compilation conditional_compilation.c
Anche se nel file non è presente nessuna riga #define DEBUG
il simbolo è stato definito a tempo di compilazione quindi siamo in stagig è l'output del programma sarà:
vagrant@ubuntu2204:~$ ./conditional_compilation
Staging code, debugging is enabled
Ovviamente è possibile all'interno del codice annulla la dichiarazione del simbolo con #undef DEBUG
in questo modo:
#include<stdio.h>
#undef DEBUG
int main(void){
#ifdef DEBUG
printf("Staging code, debugging is enabled");
#else
printf("Production code, no debugging enabled");
#endif
return 0;
}
anche definendo il simbolo da gcc
questo verrà annullato dalla direttiva #undef
e l'output del programma sarà:
vagrant@ubuntu2204:~$ gcc -o conditional_compilation -DDEBUG conditional_compilation.c
vagrant@ubuntu2204:~$ ./conditional_compilation
Production code, no debugging enabled
I file d'intestazione contengono dichiarazioni sia di funzioni (prototipi) ma anche di dati (strutture, definizione di tipo, variabili e costanti); questi file possono essere inclusi in più file correndo il rischio di avere una situazione in cui lo stesso file d'intestazione è incluso due volte nello stesso sorgente; in queste situzioni il preprocessore copierà due volte il contenuto del file d'intestazione.
Se non è grosso problema, all'interno di un file .c
, avere due o più dichiarazioni (prototipi) della stessa funzione; il compilatore invece darà errore se trova due dichiarazioni di tipo identiche. Dobbiamo quindi trovare un modo di evitare inclusioni multiple dello stesso file d'intestazione in un file sorgente.
Per capire meglio facciamo un esempio: supponiamo di avere tre file header: file1.h
file2.h
file3.h
ed un file sorgente prog.c
. La situazione, mostrata nella figura di sotto, è la seguente: sia file1.h
che file2.h
includono file3.h
mentre prog.c
include file1.h
e file2.h
. In prog.c
file3.h
verrà incluso due volte: la prima volta a seguito dell'inclusione di file1.h
e la seconda per l'inclusione di file2.h
/* file1.h */
#include "file3.h"
/* file2.h */
#include "file3.h"
/* file3.h */
#define TRUE 1
#define FALSE 0
typedef int Bool;
/* prog.c */
#include "file1.h"
#include "file2.h"
int main(void){
return 0;
}
Mostrando l'output prodotto dal preprocessore vediamo che effettivamente file3.h
è stato incluso due volte in prog.c
vagrant@ubuntu2204:~$ gcc -E prog.c
# 0 "prog.c"
# 0 "<built-in>"
# 0 "<command-line>"
# 1 "/usr/include/stdc-predef.h" 1 3 4
# 0 "<command-line>" 2
# 1 "prog.c"
# 1 "file1.h" 1
# 1 "file3.h" 1
typedef int Bool;
# 2 "file1.h" 2
# 2 "prog.c" 2
# 1 "file2.h" 1
# 1 "file3.h" 1
typedef int Bool;
# 2 "file2.h" 2
# 3 "prog.c" 2
int main(void){
return 0;
}
Per risolvere il problema basta fare uso della direttiva #ifndef
in questo modo all'interno di file3.h
:
#ifndef __FILE3_H__
#define __FILE3_H__
#define TRUE 1
#define FALSE 0
typedef int Bool;
#endif
Al momento dell'inclusione se il simbolo __FILE3_H__
non è stato ancora definito questo verrà definito e verrà anche incluso il contenuto del file d'intestazione altrimenti se file3.h
è stato già incluso una prima volta il simbolo __FILE3_H__
sarà già definito ed il contenuto del file d'intestazione fino ad #endif
verrà ignorato evitando così una seconda inutile inclusione. Verifichiamo di aver risolto rilanciando lo step di preprocessamento:
vagrant@ubuntu2204:~$ gcc -E prog.c
# 0 "prog.c"
# 0 "<built-in>"
# 0 "<command-line>"
# 1 "/usr/include/stdc-predef.h" 1 3 4
# 0 "<command-line>" 2
# 1 "prog.c"
# 1 "file1.h" 1
# 1 "file3.h" 1
typedef int Bool;
# 2 "file1.h" 2
# 2 "prog.c" 2
# 1 "file2.h" 1
# 3 "prog.c" 2
int main(void){
return 0;
}
Le informazioni di seguito riportate sono solo un aiuto per fissare i concetti e vedere un'applicazione pratica in un linguaggio di programmazione dei contenuti teorici presentati a lezione e non sostituiscono in alcun modo lo studio del materiale teorico
Il computer rappresenta le informazioni attraverso sequenze di bit. Qualsiasi tipo di dato sia esso un documento, un video, audio etc viene memorizzato come una lunga fila di bit .
Il bit è l'unità atomica, l'elemento minimo, per rappresentare informazioni. Il bit può essumere solamente due valori 0
(falso/basso) 1
(vero/falso). Dati
Queste sequenze di bit possono essere difficili da interpretare e lunghe da stampare su shermo per questo si fa uso della loro rappresentazione in esadecimale di seguito riportata
In esadecimale usiamo 16 simboli da 0 a F per rappresentare tutti i possibili valori.
Ogni simbolo esadecimale (da 0 a F) può rappresentare 4 bit (
diventa in esacimale:
La memoria è una sequenza di byte (8 bit), dette celle. Ad ogni cella è associato un indirizzo per leggere e scrivere da e su di essa. La dimensione (in bit) degli indirizzi di un sistema è detta word size. Se la word size è
Visto che le informazioni sono lunghe più di un byte (più di una cella) bisogna decidere come ordinare i singoli byte dell'informazione nelle celle. Il byte più a sinistra è detto MSB (most significant byte) il byte più a destra è detto LSB (least significant byte).
10110011 00010111 00111010 01001100
< MSB > < LSB >
L'indirizzo di partenza dell'informazione è sempre quello del primo byte (della prima cella). Abbiamo due possibilità per sistemare i byte nelle celle:
- big endian: MSB nell'indirizzo più basso
- little endian: LSB nell'indirizzo più basso
Per esempio: la seguente sequenza di bit
Esistono tre diversi modi per codificare i numeri:
- Binaria tradizionale per i numeri interi senza segno
- Complemento a due per i numeri interi con segno
- Floating point per i numeri interi con parte decimale
Per i numeri interi senza segno si usa la tradizionale codifica binaria tradizionale.
Dati
Il valore decimale corrispondente alla sequenza di bit ad esso associata è ricavabile attraverso la seguente formula:
dove
La proprietà di questa codifica (
Alcuni esempi:
La codifica in complmento a due è la più utilizzata per i numeri interi con segno (positivi e negativi). Il motivo principale è che ci permette per svolgere le operazione aritmetiche gli stessi circuiti usati per i numeri senza segno ed inoltre anche in questo caso ogni valore ha associato una sola rappresentazione (come nel caso dei numer senza segno).
Per rappresentare il segno usiamo il bit più a sinistra (MSB) il più significativo. Se MSB è alto (1) il numero sarà negativo, se MSB è basso (0) il numero è positivo.
Data una sequenza di
dove
Alcuni esempi:
Se noti abbiamo usato le stesse quattro sequenze degli esempi per la codifica dei numeri senza segno. Anche se le sequenze di bit sono le stesse le codifiche (come i bit vengono interpretati) sono diverse ed i valori ottenuti a seguito del processo di codifica può essere diverso. Da notare come i valori positivi coincidono in entrambe le codifiche (il bit di segno è 0 e le due codifiche coincidono) mentre quando il bit di segno è alto il valore rappresentato è diverso (è negativo).
Anche in questo caso ogni valore ha associata una sola sequenza di bit, non ci sono due sequenze o più associate allo stesso valore. Il range di valori rappresentabili con
Lo standard C non richiede che i numeri interi con segno siano rappresentati con codifica in complemento a due ma quasi tutti i sistemi fanno questo. L'unica cosa prevista dallo standard sono gli intervalli (tutti simmetrici) per i tipi di dati predefiniti mostrati nell'immagine di sotto
Il file d'intestazione <limits.h>
contiene informazioni circa gli intervalli (costanti per estremo superiore ed inferiore: INT_MAX
, INT_MIN
, U_INT_MAX
) per i diversi tipi di interi relativi all'architettura di default del compilatore.
Nella figura di sotto sono invece riportati i range reali per i vari tipi che le implementazioni del C hanno rispettivamente per macchine a 32 e 64 bit
U = Unsigned T = Two's complement
Codifica | Intervallo valori | Caso generale (W bit) | W = 4 |
---|---|---|---|
Senza segno | |||
Complemento a 2 |
Come anticipato le sequenze di bit sono le stesse, le due codifiche si sovrappongono (una sequenza di bit ha lo stesso valore associato in entrambe le codifiche) solo nel range dei numeri positivi da
Data una sequenza di bit e conosciuto il valore in una codifica è possibile passare al valore nell'altra codifica aggiungendo o togliendo a quest'ultimo una valore pari a:
Per ottenere il valore della stessa sequenza nella codifica in complemento (con segno) basta sommare a 14 il valore 16 (
Allo stesso modo se calcolassimo il valore della sequenza nella codifica in complemento:
Per ottnere il valore nella rappresentazione senza segno dovremmo sommare a 2 il valore 16 (
Può capitare di dover convertire una rappresentazione binaria (una sequenza binaria) di un numero intero in un'altra con capacità (numero di bit per rappresentare i diversi valori) maggiore.
Consideriamo il caso di una rappresentazione di un numero intero di
Per i numeri senza segno (positivi) basterà effettuare una zero extension: cioè porre a zero i
Per i numeri con segno (complemneto a 2) basterà effetturare una sign extension: cioè copiare nei nuovi
Per esempio:
Data una rappresentazione di un numero intero (con o senza segno) di
Da un punto di vista matematico dobbiamo distinguere i casi di troncamento di numero con o senza segno.
Nel caso di numero senza segno possiamo dire che:
Data una rappresentazione
Detto in altri termini, troncare k bit da una sequenza di
Nel caso di numero con segno possiamo dire che:
Data una rappresentazione
Detto in altri termini, troncare k bit da una sequenza di
Per esempio:
int main(void){
const float gold_value = 70.57;
float your_weight;
float your_value;
printf("Please, insert your weight in kg\n");
scanf("%f", &your_weight);
your_value = yout_weight*gold_value*1000;
printf("Your weight in gold is: %2.f\n");
}
Il linguaggio C riconosce differenti tipi di dato predefiniti. Fino ad ora abbiamo visto solo il tipo int
, di seguito riportiamo tutto le keyword riconosciute dal C per gli specificatori di tipo:
Keyowrd |
---|
int |
long |
short |
unsigned |
signed |
char |
float |
double |
void |
int
permette di rappresentare in memoria i tipi interi (senza parte decimale), le successive quattro keyword in tabella: long
short
unsigned
e signed
son usate per ottenere variazioni del tipo base (es: unsigned short int
o long long int
). char
è usato per rappresentare i singoli caratteri, simboli d'interpuzione etc; char
può essere utilizzato anche per esprimere int
di piccole dimensioni. float
double
e long double
sono usati per i numeri reali, numeri con parte decimale.
Il tipo int
è signed
questo vuol dire che possiamo esprimere sia numeri positivi (segno +) sia numeri negativa (segno -). La dimensione in bit usata per rappresentare un int
(e quindi anche il valore intero massimo esprimibile) dipende dall'architettura. Tipicamente un int
utilizza una word nell'architettura target: quindi nei sistemi con word a 16 bit (IBM compatibile) int
occuperà 16 bit. Quale sarà il valore massimo e minimo rappresentabili con un int
a 16 bit? Semplice:
Con 16 bit possono esprimere 65536 diverse combinazioni di bit (65536 diversi valori):
Questi 65536 valori devono essere assegnati metà ai i numeri negativi e metà ai positivi
Per i numeri positivi le diverse 32768 combinazioni devono essere assegnate a partire dallo zero, quindi i numeri positivi andranno da 0 fino a 32767. Per i numeri negativi (non avendo lo zero) i valori andranno da -1 a -32768.
Le stesse considerazioni valgono per macchina con word a 32 o 64 bit. In questi sistemi int
sarà rispettivamente a 32 e 64 bit.
Quindi, lo spazio occupato in memoria da un int
dipende dalla dimensione della word della macchina che può essere 16,32 o 64 bit a seconda del tipo di architettura. Lo standard ISO C specifica solo la dimensione minima di int
: 16 bit con range [-32767, +32767]
int a; /* dichirazione di intero, non inizializzato */
int b, c, d; /* dichiarazione di interi nella stessa riga */
a = 10; /* assegnamento */
int x = 100; /* dichiarazione di intero con inizializzazione */
int y = 101, z = 102; /* dichiarazione di interi nella stessa riga con inizializzazione */
int q, w = 200 /* q non è inizializzata, w è inizializzata. scarso stile di programmazione */
Usa %d
(decimal int) per stampare una variabile di tipo int
in base 10.
#include<stdio.h>
int main(void){
int ten = 10;
int two = 2;
printf("%d - %d = %d\n", ten, 2, ten - two);
}
Usa %o
per stampare una variabile di tipo int
in base 8.
Usa %x
per stampare una variabile di tipo int
in base 16
Se vuoi stampare il prefisso per la base aggiungi il #
: %#o
, %#x
include<stdio.h>
int main(void){
int x = 100;
printf("decimale = %d, ottale = %o, esadecimale = %x\n", x, x, x);
printf("decimale = %d, ottale = %#o, esadecimale = %#x\n", x, x, x);
}
Il linguaggio offre le keyword short
long
unsigned
per modificare il tipo int
di default.
Tipo | Descrizione |
---|---|
int |
Deve essere almeno di 16 bit. E' signed |
short int o short |
non può essere più grande di int , potrebbe usare meno memoria di int salvando spazio quando si rappresentano interi piccoli. Come int è signed di default |
long int o long |
non può essere più piccolo di int , potrebbe usare più memoria di int , utile per rappresentare interi molti grandi. Come int è signed di default |
long long int o long long |
Deve essere almeno di 64 bit. Potrebbe usare più memoria di long . Come int è signed di default |
unsigned int o unsigned |
Usato per valori solo positivi. Il tipo shifta a destra il range di rappresentazione, esempio con 16 bit avendo 65736 possibili rappresentazioni ed escludendo i valori negativi il range passa da [-32768, 32767] a [0, 65735] |
unsigend long int o unsigned long |
Previsto da C90 |
unsigend long int o unsigned long |
Previsto da C90 |
unsigend long long int o unsigned long long |
Previsto da C99 |
Lo standard quindi non specifica la dimensione precisa dei diversi interi, l'idea è che il tipo si adatterà alla dimensione della word dell'architettura di riferimento. Lo standard richiede solamente che:
int
deve essere almeno 16 bitshort
non può essere più grande diint
long
non può essere più piccolo diint
long long
deve essere almeno 64 bit
16 bit | 32 bit | 64 bit |
---|---|---|
short 16 |
short 16 |
short 16 |
int 16 |
int 32 |
int 16 o 32 (dipende dalla word dell'architettura) |
long 32 |
long 32 |
long 32 |
long long |
long long |
long long 64 |
Quando allora usare i diversi tipi di interi? Dipenda dalla situazione.
unsigned
è usato per contare perchè non rappresenta i numeri negativi eunsigned
shiftando a destra il range rappresentabile può raggiungere valori maggiori di unsigned
long
è usato per rappresentare valori cheint
non riesce a rappresentare. Tieni conto che nei sistemi in cuilong
è maggiore diint
usarelong
rallenta i calcoli, quindi usalo solo ne necessario. Altre considerazioni possono essere fatte sulla portabilità: se hai bisogno di interi a 32 e stai scrivendo codice su una macchina doveint
elong
sono a 32 bit dovresti sceglierelong
in modo tale che se il programma viene portato su macchine a 16 bit doveint
è 16 il tuo intero sarà sempre a 32 bit perchèlong
su sistema a 16 bit è lungo 32 bitlong long
è usato solo quando gli interi devono essere lunghi 64 bitshort
è usato per risparmiare spazio, nel senso se i tuoi interi possono essere lunghi solo 16 bit usareint
potrebbe renderli lunghi 32 bit (in macchine a 32 bit e superiori).
Tipo | 10 | 16 | 8 |
---|---|---|---|
int |
%d |
%x |
%o |
unsigned |
%u |
%ux |
%uo |
short |
%h |
%hx |
%ho |
unsigned short |
%hu |
%hux |
%huo |
long |
%ld |
%lx |
%lo |
unsigned long |
`%lu | %lux |
%luo |
long long |
%lld |
%llx |
%llo |
#include<stdio.h>
int main(void){
unsigned int un = 300000000;
short end = 200;
long big = 65537;
long long verybig = 12345678908642;
/* Udasa un segnaposto errara nella printf() porta a
* risultati strani */
printf("un = %u and not %d\n", un, un);
printf("end = %hd and not %d\n", end, end);
printf("big = %ld and not %hd\n", big, big);
printf("verybig = %lld and not %ld\n", verybig, verybig);
return 0;
}
vagrant@ubuntu2204:/lab/3_datatype$ bin/print_others_ints
un = 300000000 and not 300000000
end = 200 and not 200
big = 65537 and not 1
verybig = 12345678908642 and not 12345678908642
Cosa accade quando si cerca di rappresentare un numero intero più grande del massimo valore rappresentabile: quando si esce fuori dal range massimo. Vediamo in questo esempio.
Consideriamo un sistema a 32 bit quindi int
32.
Per gli `unsigned` avremo un range:
[0, 4294967295]
Per i `signed` avremo un range:
[-2147483648:-1 , 0: 2147483647]
|<--negativi--->|<--postivi--->|
#include<stdio.h>
int main(void){
int i = 2147483647;
unsigned int j = 4294967295;
printf("Signed: %d %d %d\n", i, i+1, i+2);
printf("Unsigned: %u %u %u\n", j, j+1, j+2); /* we need to use %u for unsigned int */
return 0;
}
vagrant@ubuntu2204:~$ ./int_overflow
Signed: 2147483647 -2147483648 -2147483647
Unsigned: 4294967295 0 1
La rappresentazione dei numeri interi si comporta come un odometro (vedi figura di sotto).
Ricordiamo che dati
- con segno:
$[-2^{W-1}:-1, 0:2^{W-1}-1]$ - senza segno:
$[0, 2^{W}-1]$
Per i numeri con segno, abbiamo due casi.
-
un intero positivo, raggiunto il valore massimo (
$+2^{W-1}-1$ ), se incrementato di un'altra unità assume il valore minimo negativo rappresentabile($-2^{W-1}$ ). In figura$W=4$ , il valore massimo positivo è$2^3-1=+7$ che ha codifica$0111$ se sommiamo 1 otteniamo un effetto a cascata del riporto$1000$ che in complento a due (siamo con numeri con segno) vale:
che è appunto il valore minimo rappresentabile
-
un intero negativo, raggiunto il valore massimo (
$-1$ ), se incrementato di un'altra unità assume il valore minimo positivo rappresentabile ($0$ ). In figura In figura$W=4$ , il valore massimo negativo è$-1$ che ha codifica in complemento a due$1111$
se sommiamo 1 otteniamo
Per i numeri senza segno abbiamo:
-
un intero senza segno, raggiunto il valore massimo (
$2^{W}-1$ ), se incrementato di un'altra unità assume il valore minimo rappresentabile($0$ ). Per esempio sempre con$W=4$ il valore massimo rappresentabile è$2^4-1=15$ che ha una codifica$1111$
se sommiamo 1 otteniamo
Important
Una qualunque operazione aritmetica su interi si dice in overflow quando l'intero risultante dall'operazione ha una dimensione in bit superiore alla dimensione massima (in bit) del tipo di dato. I bit eccedenti sono semplicemente scartati.
La rappresentazione dei numeri interi con segno (signed
, di default per la keyword int
) è in complemento a due, per gli interi senza senzo (unsigned int
) si usa una normale rappresentazione binaria del valore intero.
Nel codice di sotto proviamo a predire la sequenza binaria di un valore decimale scelto arbitrariamente. Per comprendere il codice è necessaria una conoscenza del processo di conversione da decimale a binario oltre che ovvia
mente alle basi relative sia al sistema numerico posizionale binari che esadecimale. Trovi la teoria trattata a lezione qui
#include<stdio.h>
/*
* Calcoliamo la rappresentazione binaria del valore 27:
*
* valore resto
* 27 | 2 | 1
* 13 | 2 | 1
* 6 | 2 | 0
* 3 | 2 | 1
* 1 | 2 | 1
* 0 |
*
* 7 6 5 4 3 2 1 0
* +---+---+---+---+---+---+---+---+
* | 0 | 0 | 0 | 1 | 1 | 0 | 1 | 1 |
* +---+---+---+---+---+---+---+---+
* 16 + 8 + + 2 + 1 = 27
*
* Calcoliamo la rappresentazione esadecimale del valore 27:
* 0001 1011
* \ / \ /
* 1 B
*
* Gli interi signed sono rappresentati in questo modo, quindi
* il valore 27 unsigned stampandolo in esacimale con printf()
* deve restituire 0x1B
*
* Per gli interi con segno si usa la rappresentazione in comp
* lemento a due, per trovare la sequenza di bit del valore ne
* tivo dobbbiamo calcolare il complemento a 2 del valore posi
* tivo ( nega tutti i bit ed aggiungi uno)
*
* signed: 00011011
* negato: 11100100
* +1 : 11100101
*
* 1110 0101
* \ / \ /
* E 5
*
* Gli interi su questa architettura sono a 32 bit ( 4 byte )
* Per gli altri byte estendiamo il bit di segno (MSB) del pri
* mo byte
*
* 00000000 00000000 00000000 00011011
* 11111111 11111111 11111111 11100101
*
*/
int main(void){
int positive = 27;
int negative = -27;
unsigned u_positive = 27;
/*
* stamperemo gli interi in esadecimale (base 16) per
* verificare la diversa rappresentazione degli interi
* di tipo signed ed unsigned
*/
printf("signed positive: %#x\n", positive); /* mi aspetto 0x00-00-00-1B */
printf("signed negative: %#x\n", negative); /* mi aspetto 0xff-ff-ff-E5 */
printf(" unsigned: %#x\n", u_positive);
return 0;
}
vagrant@ubuntu2204:/lab/3_datatype$ bin/print_int
signed positive: 0x1b
signed negative: 0xffffffe5
unsigned: 0x1b
Il cast è una conversione esplicita di tipo e prevede un proprio operatore. Esistono altri tipi di conversioni di tipo: conversione automatica e conversione per assegnamento.
Important
Conversione automatica Le conversioni automatiche prevedono che nelle espressioni che coinvolgoo costanti o variabili di tipo diverso il tipo del risultato è pari a quello dell'operando più capiente in termini di bit
Nel codice di sotto il valore che viene stampato è 1, la divisione è tra due interi quindi il risultato anche se è un numero reale (con parte decimale) sarà di tipo intero e la parte decimale verrà troncata.
int x = 8, y=5;
printf("%i\n", x/y);
Nel secondo caso (codice sottostante) invece la divisione coinvolge un intero (int
) ed un numero reale (double
) ed il risultato sarà dunque un double
, Il tipo del risulato è uguale a quello dell'operando con maggiore capacità in termini di bit.
int x = 8;
double y = 5;
printf("%lf\n", x/y);
Important
Conversione per assegnamento il valore assegnato viene convertito nel tipo dell'espressione a sinistra dell'operatore di assegnamento (detto lvalue)
int n1, n2;
double a = 1.6, b= -1.6
n1 = a;
n2 = b;
Nell'esempio di sopra vengono assegnati dei valori double
a degli int
, il risultato è che a seguito del troncamento della parte decimale ad n1
viene assegnato il valore 1 ed a n2
-1
Nel caso di sotto invece, si ha un assegnamento da un tipo più capiente (int
) ad uno meno (char
). Il valore che viene assegnato ad n
è 3. La rappresentazinoe binaria di 259 è:
259 | 2 | 1
129 | 2 | 1
64 | 2 | 0
32 | 2 | 0
16 | 2 | 0
8 | 2 | 0
4 | 2 | 0
2 | 2 | 0
1 | 2 | 1
0
int è a 32 bit quindi:
00000000 00000000 0000001 00000011
assegnando questa configurazione di bit ad un char che occupata solo 8 bit i primi 3 ottetti andranno persi e la configurazione binaria copiata nella variabile n
sarà
00000011
che corrisponde al valore 3 in deciimale
unsigned char n;
int a = 259;
n = a;
Important
Conversione esplicita: CAST
Le conversioni esplicite vengono effettuate usando l'operatore di cast. L'operatore di cast è costituito dalla parentesi tonde (
)
e questa è la sua sintassi
(nome_del_tipo) espr_da_castare
In questo modo si forza la conversione del valore restituito dall'espressione (espr_da_castare
) nel tipo specificato da nome_tipo
, esempio:
int x = 8, y = 5;
printf("%lf\n", x / (double) y);
Il codice di sopra stampa 1.6 in quanto prima di effettuare la divisione il valore di y
viene convertito in double
e quindi viene svolta una divisione tra int
e double
, per le regole della conversione automatica il valore della divisione sarà quello del tipo più capiente: double
.
Se invece il cast venisse fatto in questo modo:
printf("%lf\n", (double)(x/y));
il valore stampato sarebbe 1.0 perchè prima vine effettuata la divisione tra int
ed il risultato è un int
pari ad 1 e poi questo intero viene trasformato in double
.
Note
Quando si effettua il cast di una variabile i bit memorizzati non vengono alterati in alcun modo
In C, il cast in entrambi i versi: da signed ad unsigned e viceversa, non cambia mai la configurazione dei bit ma soltanto l'interpretazione che viene data alla sequenza di bit. Vediamo un esempio:
#include<stdio.h>
/*
* Usiamo la rappresentazione in complemento a due del valore 27
* che abbiamo calcolato nell'esercizio precedente e che è: 0xE5
*
* shoirt int v = -27
* è un numero con segno (complento a due) ma short (16 bit) la
* rappresentazione in esadecimale (complemento a 2) è: 0xff-ff
* ff-E5
*
* Cosa accade se facciamo un cast da unsigned a signed? Per se
* mplicita stiamo consideriamo short int per avere solo 16 bit.
*
* 0XFF-FF-FF-E5 in binario è:
* +---+---+---+---+---+---+---+---+
* | 1 | 1 | 1 | 0 | 0 | 1 | 0 | 1 |
* +---+---+---+---+---+---+---+---+
*
* Castando il tipo (short int) al tipo (unsigned int) la rap-
* presentazione (la seuqenza di bit) rimarrà la stessa ma l'
* interpretazione che il sistema darà ai bit sarà diversa.
* Nel caso di (short int) sarà interpretato in complemento a
* due, nel caso di (unsigned int) come una sequenza binaria
* il cui valore è:
*
* +---+---+---+---+---+---+---+---+
* | 1 | 1 | 1 | 0 | 0 | 1 | 0 | 1 |
* +---+---+---+---+---+---+---+---+
* 128 + 64+ 32+ 4 + 1 = 229
*
* Gli altri 8 bit (dal 15-esimo all'ottavo) sono tutti a uno
* otto bit ad uno (0xff) 255 shiftati di otto 255*(2^8)=65280
* 65280+229 = 65509
* Mi aspetto che il sistema a seguito del cast stamperà 65509
*/
int main(void){
short int v = -27;
unsigned int u_v = (unsigned short) v;
printf("v = %d, u_v = %u\n", v, u_v); /* mi aspetto 0xFF-E5 */
printf("v = %#x, u_v = %#x\n", v, u_v); /* mi aspetto sempre 0xff-e5 ma valore decimale 65509 */
return 0;
}
Lo stesso discorso vale nel caso di cast nel verso opposto:
#include<stdio.h>
/*
* Anche nel caso di cast da unsigned a signed
* la sequenza di bit rimane invariata ma cambia
* solo l'interpretazione data alla sequenza.
* Scegliendo come valore senza segno l'estremo
* superiore della rappresentazione (UMax) che
* nel caso di (unsigned short) e' 65536 (2^16)
* per conoscere il valore con segno basta sot
* trarre (UMax + 1) o 2^W
*/
int main(void){
unsigned short u = 65535; /* UMax */
short int tu = (short int) u;
printf("u = %u, tu=%d\n", u, tu);
printf("u = %#x, tu=%#x\n", u, tu);
return 0;
}
vagrant@ubuntu2204:/lab/3_datatype$ bin/cast_tra_unsigned_signed
u = 65535, tu=-1
u = 0xffff, tu=0xffffffff
Il cast può avvenire sia eslicitamente con l'operatore di cast o anche implicitamente in un assegnmento:
#include<stdio.h>
int main(void){
int tx, ty;
unsigned ux, uy;
ux = 4294967295; /* il cast cambia il valore */
ty = 2147483647; /* il cast non cambia il valore */
int tx_, ty_;
unsigned ux_, uy_;
ux_ = ux;
ty_ = ty;
/* cast esplicito */
tx = (int) ux;
uy = (unsigned) ty;
/* cast implicito */
tx_ = ux_;
uy_ = ty_;
printf("unsigned = %ld byte\n", sizeof(unsigned int));
printf(" int = %ld byte\n", sizeof(int));
printf("\n");
printf("ux = %u, tx = %d\n", ux, tx);
printf("ux_ = %u, tx_ = %d\n", ux_, tx_);
printf("\n");
printf("uy = %u, ty = %d\n", uy, ty);
printf("uy_ = %u, ty_ = %d\n", uy_, ty_);
printf("\n");
/* se prendo un valore intero negativo allora cambia il valore castando verso unsigned */
int cast_me = -2147483648; /* TMin */
int u_cast_me = (unsigned) cast_me; /* Tmax+1 = (unsigned) TMin */
printf("cast_me = %d, u_cast_me = %u\n", cast_me, u_cast_me);
}
Caution
Gestione delle espressioni contenenti combinazioni di valori signed ed unsigned: quando un'operazione è calcolata e un operando è signed e l'altro unsigned, C implicitamente casta il valore signed ad unsigned e solo dopo calcola l'operazione
Le costanti unsigned si specificano la lettera U, nell'esempio di sotto i due operandi dell'espressioni sono diversi (signed ed unsigned): prima -1 (valore signed) viene trasformato in signed (
-1 < 0U
Sotto altri esempi
Come anticipato nella teoria quando si estende la rappresentazione binaria di un numero abbiamo due casi:
- Se il numero è unsigned si effettua zero extension: si copia nei nuovi bit il valore 0
- Se il numero è signed si effettua sign extension: si copia il valore contenuto nel bit più significativo (MSB) della vecchia rappresentazione nei nuovi bit della nuova rappresentazione
#include<stdio.h>
int main(void){
short sx = -12345;
unsigned short usx = sx; /* short: 16 bit, UMax = 2^16 -1 = 65535
* per passare da valore signed ad unsigned
* basta sommare Umax + 1 quindi:
* usx = -12345 + 65536 = 53191
*/
int x = sx; /* int: 32 bit, verranno aggiunti 16 bit al
* la sequenza di 16 bit che rappresenta sx
* siccoma int è signed sarà effettuata una
* sign extension e non una zero extension
* nei sedici bit MSB aggiunti verrà copia
* to 1 e non 0 perchè sx era negativo ed è
* rappresentato in complemento a due dove
* MSB è il bit di segno (0=+, 1=-)
* x = -12345 (ma con 32 e non 16 bi)
*/
unsigned ux = usx; /* usx è unsigned short, aumentando i bit
* della sequenza da 16 a 32 ( con il cast
* da (unsigned short) a (unsigned) sarà
* effettuata una zero extension.
* ux = 53191 (ma con 32 e non 16 bit)
*/
printf("sx = %d \t %#hx\n", sx, sx);
printf("usx = %u \t %#hx\n", usx, usx);
printf("x = %d \t %#x\n", x, x);
printf("ux = %u \t %#x\n", ux, ux);
return 0;
}
vagrant@ubuntu2204:/lab/3_datatype$ bin/estensione_della_rappresentazione_binaria
sx = -12345 0xcfc7
usx = 53191 0xcfc7
x = -12345 0xffffcfc7
ux = 53191 0xcfc7
Come puoi notare sx
e usx
sono entrambi short
il primo con segno ed il secondo senza segno ma hanno la stessa rappresentazione binaria (il cast non cambia la configurazione dei bit ma solo l'interpretazione). Invece x
ed ux
sono a 32 bit rispettivamente con segno e senza segno ed hanno sequenze di bit diverse (x
0xffffcfc7
, ux
0xcfc7
) questo perchè x
è con segno e quindi si effettua sign extension cioè MSB di sx
è 1 e quindi vengono copiati nei nouvi 16 MSB tutti valori posti ad 1. Invece ux
è unsigned ed anche se usx
ha MSB alto (c esadecimale in binario è 1100) viene effettuato uno zero extension
In una situazione in cui si effettua un cast da un tipo meno capiente con segno ad uno più capiente senza segno il C deve svolgere due operazioni: l'estensione dei bit ed il cast (cioè interpretare la sequenza di bit secondo il nuovo tipo). Non è difficile comprendere che il risultato finale (il valore) dipende dall'ordine di esecuzione di queste due operaizioni, vediamo un esempio:
#include<stdio.h>
int main(void){
short sx = -12345;
unsigned uy = sx;
printf("sx = %hd \t\t %hx\n", sx, sx);
printf("uy = %u \t %x\n", uy, uy);
}
sx
vale 0xcfc7
MSB = 1 (c = 1100) se viene effettuato prima il cast la sequenza di bit viene considerata unsigned e si effettua zero extension ed uy
vale 0x0000cfc7
; se poi si effettua il cast ad unsigned, la sequenza ottenuta vale +12345
Se invece viene effettuato prima l'estensione dei bit sx
è ancora signed e viene eseguita una sign extension in questo modo 0xffffcfc7
; successivamente si effettua il cast ad unsigned e la sequenza varrà
vagrant@ubuntu2204:/lab/3_datatype$ bin/mistero
sx = -12345 cfc7
uy = 4294954951 ffffcfc7
#include<stdio.h>
int main(void){
int x = 53191;
/* castando int x a short avremo il trocamento dei 16 bit (MSB) */
short sx = (short) x; /* -12345 */
int y = sx; /* -12345 signed short 2 signed con sign extension */
printf("x = %d \t %x\n", x, x);
printf("sx = %hd \t %hx\n", sx, sx);
printf("y = %d \t %x\n", y, y);
return 0;
}
vagrant@ubuntu2204:/lab/3_datatype$ bin/troncamento_bit
x = 53191 cfc7
sx = -12345 cfc7
y = -12345 ffffcfc7
Il tipo char
è usato per memorizzare caratteri, la dichiarazione di una variabile di tipo char
è fatta in questo modo:
char letter;
char one, two;
Per inizializzare un variabile di tipo char
ad uno specifico carattere è necessario usare il singolo apice: '
in questo modo:
char lettera_a = 'A';
char lettera_b = 'B';
Inizializzare le variabili char
come nel codice di sotto è un grave errore:
char errore = "T"; /* i doppi apici sono usati per le stringhe, non per i caratteri */
char altro_errore = T /* T senza apici singoli è interpretata come una variabile */
Il tipo char
è lungo 1 byte (8 bit) e in verità è un tipo intero: nel senso che il carattere viene memorizzato come un intero senza sengo e poi attraverso una tabella di codifica/decondifica (ASCII) il valore numerico viene convertito nel carattere corrispondente.
Per stamapre su schermo il contenuto di una variabile di tipo char
si usa %c
#include<stdio.h>
int main(void){
char lettera_a = 'A';
printf("%c\n", lettera_a); /* stampa il carattere A */
printf("%d\n", lettera_a); /* stampa il valore intero usato per codificare il carattere A */
printf("%u\n", lettera_a); /* stampa il valore senza segno, dovrebbe essere lo stesso */
printf("%#x\n", lettera_a); /* stampa la rappresentazione esadecimale */
}
vagrant@ubuntu2204:/lab/3_datatype$ bin/print_char
A
65
65
0x41
Il valore decimale per rappreentare il carattere A
è 65, in memoria vengono salvati valori binali che poi attraversi il sistema di codifica ASCII vengono convertiti in caratteri
TODO
Gli operatori sono usati nelle operazione aritmetiche.
Il simbolo di uguale =
come abbiamo già visto viene usato per assegnare il valore ad una variabile e non rappresenta l'uguaglianza come invece siamo abitutati a pensarlo.
Il codice di sotto usa l'operatore =
per assegnare il valore 1234
alla variabile mio_intero
mio_intero = 1234;
mio_intero
è l'identificatore attraverso cui il programmatore può accedere alla locazione di memoria corrispondente.
mio_intero
è anche detto lvalue mentre 1234
è detto rvalue
Un lvalue identifica appunto una locazione di memoria (referenzia un indirizzo di memoria) e può essere usato a sinistra di un operatore di assegnamento (l
in lvalue
sta per left in inglese). Per la verità mio_intero
è detto modifiable lvalue perchè è modificabile (non è una costante).
Un rvalue può essere usato a destra di un operatore di assegnamento (quantità che possono essere assegnati ad un modifiable lvalue) questo può essere un: una costante, una variabile o un'espressione che ritorna un valore (es. una chiamata a funzione).
int main(void){
int uno;
int due;
const int tre = 3;
uno = 1;
due = (uno + 1);
tre = due + 1; /* ERRORE!
* tre è una costante (non è modificabile) non può essere usato come lvalue
* di un opeatore di assegnamento.
*/
due = tre - 1;
}
L'operatore di somma +
somma tra loro il valore dei suoi operandi
int main(void){
int uno = 1;
int due = 2
int quattro = uno + due + 1
}
L'operatore differenza -
sottrae il valore dell'operando di destra al valore dell'operando di sinistra
L'operatore segno permette di specificare o alterare il segno di un valore. Questo è un operatore unario perchè agisce su un singolo operando al contrario degli operatore che abbiamo vista fino ad ora.
int main(void){
int uno = +1;
int meno_uno = -1;
}
Questo operatore effettua il prodotto del valore dei due operandi
int main(void){
int prodotto = 3 * 2;
}
L'operatore /
effettua la divisione del valore dei due operandi. Il risultato dipende dal tipo degli operandi come si vede nel codice di sotto.
#include<stdio.h>
int main(void){
printf("5/4=%d\n",5/4);
printf("6/3=%d\n",6/3);
printf("5.0/4.0=%1.2f\n",5.0/4.0);
printf("6.0/3.0=%1.2f\n",6.0/3.0);
printf("5.0/4=%1.2f\n",5.0/4);
printf("6/3.0=%1.2f\n",6/3.0);
}
L'operatore ritorna il numero di byte occupati dal suo operando. L'operatore può essere sia una variabile sia il nome di un tipo. Il valore tornato da sizeof
è di tipo size_t
che è semplicemente un unsigned int
o un unsigned long
che è stato ridefinito con typedef
.
Note
typedef permette di definire un alias per un tipo di dato, per esempio typedef unsigned int positivo
associa l'alias positivo
al tipo unsigned int
in moda da poter dichiarare varaibili intere positive in entramvi i seguenti modi: unsigned int a
, positivo a
.
#include<stdio.h>
int main(void){
int n = 0;
size_t int_in_byte;
int_in_byte = sizeof(int);
printf("n = %d, n occupa %zd bytes\n", n, sizeof n);
printf("Gli interi occupano %zd bytes\n", int_in_byte);
return 0;
}
Come avrai notato sizeof
può essere usato con o senza parentesi tonde. L'uso delle parentesi è obbligatorio solo quando l'operando è un tipo ma è meglio usarle sempre. Per stampare un tipo size_t
puoi usare %zd
o in alternativa %u
o %lu
.
L'operatore modulo ritorna il resto della divisione dei suoi due operandi
#include<stdio.h>
int main(void){
int n;
printf("Inserisci un numero tra 1 e 10\n");
scanf("%d", &n);
int pari_o_dispari = n % 2;
if(pari_o_dispari == 0){
printf("%d e' pari\n", n);
} else{
printf("%d e' dispari\n", n);
}
return 0;
}
Questi operatori incrementano o decrementano il proprio operando di un'unità. Possono essere usati in due versioni prima dell'operando o dopo l'operando in questo modo:
int i = 0;
i++; /* dopo l'operando i */
++i; /* prima dell'operando i */
i--; /* dopo l'operando i */
--i; /* prima dell'operando i */
Il risultato è equivalente ad un normale incremento e decremento
i = i + 1;
i = i - 1;
Perchè due versioni dello stesso operatore?
#include<stdio.h>
int main(void){
int i = 0;
int j = 0;
int z = 0;
i++;
++j;
z = z + 1;
i++;
++j;
z = z + 1;
i++;
++j;
z = z + 1;
i++;
++j;
z = z + 1;
printf("i=%d, j=%d, z=%d\n", i, j, z);
return 0;
}
vagrant@ubuntu2204:/lab/4_operators$ bin/op_incremento_decremento
i=4, j=4, z=4
Sembra che il risultato sia lo stesso ma esiste una sottile differenza tra l'uso dell'operatore nella versione pre e post. Quando l'operatore precede l'operando (versione pre) prima viene incrementato il valore dell'operando di un'unità e poi viene valutato l'operando, diversamente quando l'operatore segue l'operando (versione post) prima viene valutato il valore dell'operando e successivamento lo si incrementa di uno.
#include<stdio.h>
int main(void){
int i = 0;
int j = 0;
int ii = i++; /* prima viene valutato i ( assegnato il suo valore ad ii )
* successivamente i viene incrementato di uno ma ii rimane
* al valore precedente di i, cioè 0
*/
int jj = ++j; /* prima j viene incrementato di uno e poi viene valutato il
* il suo valore (assegnato alla variabile jj). In questo ca
* jj vale 1
*/
printf("i=%d, ii=%d\n", i, ii);
printf("j=%d, jj=%d\n", j, jj);
return 0;
}
Quindi quando l'operatore è usato singolarmente non c'è differenza nell'usare la versione pre o post ma quando questo si trova all'interno di un'espressione (assegnamento, test di un loop) allora dobbiamo tenere in considerazione questa lieve differenza tra i due.
Operatori Logici
Operatore | Significato |
---|---|
&& |
and |
|| |
or |
! |
not |
Operatori Relazionali
Operatore | Significato |
---|---|
< |
minore di |
> |
maggiore di |
<= |
minore o uguale |
>= |
maggiore o uguale |
== |
uguale uguale |
!= |
diverso |
Il costrutto if
serve per realizzare l'istruzione di salta condizionale ed ha questa forma:
if ( espr ) istr
Se la condizione è vera (cioè diversa da zero) viene esguito il blocco di istruzioni istr
, altrimenti si prosegue con l'elaborazione.
Note
Come tutti gli altri costrutti, il blocco istr
può rappresentare una singola istruzione, un altro costrutto di controllo, oppure un blocco di itruzioni racchiuse tra parentesi graffe
il costrutto if
ammette l'enunciato opzionale else
in questa forma:
if ( espr ) istr1 else istr2
I blocchi di istruzioni istr1
e istr2
vengono eseguiti a seconda che l'espressione espr
sia rispettivamente vera o falsa.
#include<stdio.h>
int main(void){
int n;
printf("Inserisci un numero tra 1 e 10\n");
scanf("%d", &n);
int pari_o_dispari = n % 2;
if(pari_o_dispari == 0){ /* Se la condizione e' vera (diversa da zero)
* il flusso entra in questo blocco, stampa
* "n e' pari" ed il blocco else viene saltato
*/
printf("%d e' pari\n", n);
} else{ /* Se la condizione e' falsa ( uguale a zero )
* il blocco if viene saltato e si entra nel
* blocco else e viene stampata la stringa
* "n è dispari"
*/
printf("%d e' dispari\n", n);
}
return 0;
}
#include<stdio.h>
int main(void){
int stipendio_base = 1000;
int stipendio_medio = 3000;
int stipendio_alto = 5000;
int eta;
char laurea = 0;
printf("Inserisci la tua eta'\n");
scanf("%d", &eta);
printf("Hai la laurea?\n");
printf("[S]ì \t [N]o\n");
scanf(" %c", &laurea);
if(laurea == 'S' || laurea == 'N') {
if(eta < 30){
printf("Sei giovane, il tuo stipendio e' %d\n", stipendio_base);
} else if (eta > 30 && eta < 50 && laurea == 'N'){
printf("Non hai la laurea, il tuo stipendio e' %d\n", stipendio_base);
} else if (eta > 30 && eta < 50 && laurea == 'S'){
printf("Hai la laurea, il tuo stipendio e' %d\n", stipendio_medio);
} else {
printf("Hai esperienza, il tuo stipendio e' %d\n", stipendio_alto);
}
} else {
printf("Digita S per sì o N per no\n");
return 1;
}
return 0;
}
Il costrutto for
serve per realizzare un ciclo (loop) permette di eseguire un'istruzione (o un insieme di istruzioni) per un certo numero di volte consecutivamente. Ha questa forma:
for ( espr1; espr2; espr3 ) istr
Prima di iniziare il ciclo viene valutata una volta sola espr1
che viene tipicamente utilizzata per inizializzare le variabili che controllano il ciclo, poi viene valutata l'espressoine espr2
. Se espr2
è vera (diversa da zero) venogono eseguite le istruzioni del corpo del ciclo rappresentate da istr
. Quando espr2
è falsa (uguale a zero) il ciclo termina. Prima di valutare espr2
una seconda volta viene prima eseguita espr3
che viene usata per incrementare o decrementare la variabile che controlla il ciclo
#include<stdio.h>
int main(void){
for(int i = 0; i < 10; i++){
printf("%d ", i);
}
printf("\n");
return 0;
}
Il costrutto while
serve (come il for
) per realizzare un ciclo. Ha questa forma:
while ( espr ) istr
Il ciclo while
continua ad eseguire il ciclo finzh+ la condizione indicata da espr
risulta vera. Il ciclo termina quando la condizione è falsa. Se la condizione è inizialmente falsa il blocco non viene mai eseguito. I costrutti while
e for
sono equivalenti: ogni for
può essere eseguito con un while
e viceversa.
#include<stdio.h>
int main(void){
int i = 0;
while(i < 10){
printf("%d ", i);
i++;
}
printf("\n");
return 0;
}
Il costrutto do-while
serve per realizzare un ciclo ed assume questa forma:
do instr while ( espr )
A differenza del costrutto while
, il blocco di istruzioni nel ciclo viene eseguito almeno una volta infatti la condizione che controlla l'esecuzione del ciclo viene valutata alla fine del ciclo.
#include<stdio.h>
int main(void){
int i = 0;
/* i++ prima viene valutato il valore di i (si stampa il suo valore)
* dopo i viene incrementata di 1 , poi si controlla che sia < 10
* cosa accade se uso ++i?Invece di stampare da 0 a 9 stampo da 1 a 10
*/
do {
printf("%d ", i++);
} while(i < 10);
printf("\n");
return 0;
}
Lo switch
è assolutamente equivalente ad un if-esle
e serve a scegliere tra diversi blocchi di istruzioni in base al valore di una espressione intera. La sintassi è la seguente:
switch ( espressione-intera ) {
case espressione-costante :
[ istr ]
[ ... ]
[ break ; ]
case espressine-costante :
[ istr ]
[ ... ]
[ break ; ]
[ default: ]
[ istr ]
[ ... ]
[ break ; ]
}
Le parentesi quadre [
, ]
indicano parti del costrutto opzionali. Le parentesi graffe sono obbligatorie, case
e default
sono parole chiave.
Il costrutto permette di eseguire un'istruzione o una serie di istruzioni sulla base del valore di espressione-intera
, l'esecuzione salta al case corrispondente al valore di espressione-intera
. Se nessun case
corrisponde ad espressione-intera
viene eseguita la clausola default
(se presente).
Note
Le espressioni di ogni case
devono essere espressioni intere e costanti
- La presenza di istruzioni dopo il
case
è facoltativa per permeettere di ragruppare lo stesso codice in relazione a diversi casi - la presenza di
break
alla fine di uncase
è facoltativa e quindi la mancanza dibreak
determina il continuamento dell'esecuzione del codice associato alcase
successivo default
è facoltativo- non è obbligatorio che
default
sia l'ultimo caso del costrutto
#include<stdio.h>
int main(void){
char scelta;
int a, b, c, other;
printf("a=%d \t b=%d \t c=%d \t other=%d\n", a, b, c, other);
printf("Quale variabile vuoi incrementare?\n");
printf("[a-A]\t[b-B]\t[c-C]\n");
scanf(" %c", &scelta);
switch(scelta){
case 'a':
case 'A':
a++;
break;
case 'b':
case 'B':
b++;
break;
case 'c':
case 'C':
c++;
break;
default:
other++;
/* non ho bisogno del break perchè è l'ultimo case se lo avessi messo sopra dovevo mettere il break altrimenti
* l'esecuzione del flusso sarebbe passata al codice relativo al case sottostante la clausola default
*/
}
printf("a=%d \t b=%d \t c=%d \t other=%d\n", a, b, c, other);
return 0;
}
Le istruzioni break
e continue
sono utilizzate per controllare il flusso di esecuzione nei cicli while
, do-while
e for
in particolare:
break
termina immediatamente il ciclo più interno nel quale è contenutacontinue
passa immediatamente all'interazione successiva
#include<stdio.h>
int main(void){
int i = 0;
while(1){
if(i == 10){
printf("\n");
break;
}
if(i % 2 == 0){
++i;
continue;
}
printf("%d ", i);
i++;
}
for(int j=0; ; j++){
if(j == 10){
printf("\n");
break;
}
if(j % 2 == 0)
continue;
printf("%d ", j);
}
return 0;
}
Un puntatore è una variabile che contiene un indirizzo di memoria (di un'altra cella di memoria).
Un puntatore è un intero positivo (unsigned int
). Di solito nelle macchine UNIX è di tipo unsigned long
dato che deve contenere indirizzi da 64 bit.
Per dichiarare un puntatore è necessario specificare il tipo della locazione di memoria a cui esso dovrà puntare. Un puntatore che ospita l'indirizzo di una variabile int
è di tipo diverso rispetto ad un puntatore che ospita l'indirizzo di una variabile di tipo char
. Per dichiarare il tipo del puntatore si utilizza il simbolo *
insieme al tipo della variabile a cui esso dovrà puntare. Per esempio nel codice di sotto dichiariamo una variabile intera thing
che viene inizializzata al valore 6, nella riga di sotto dichiariamo un puntatore (variabile thing_ptr
) di tipo (int *
) che conterrà l'indirizzo di memoria della variabile int
di nome thing
.
int thing = 6;
int *thing_ptr;
per un char
avremmo fatto
char thing = 'A';
char *thing_prt;
Quando un putatore è dichiarato il suo contenuto (come ogni variabile locale automatica) contiene un valore sporco assolutamente casuale. Come per tutte le altre variabili è necessario quindi inizializzare una variabile puntatore ad un indirizzo di memoria valido, per fare questo si usa l'operatore unario &
(operatore di indirizzamento) che permette di ottenere l'indirizzo di memoria di una qualsiasi variabile.
Tornando al nostro esempio se volessimo inizializzare il puntatore ad intero thing_ptr
all'indirizzo di memoria della variabile intera thing
dovremmo usare l'operatore &
in questo modo:
int thing = 6; /* ipotizziamo che l'indirizzo della variabile thing sia 0x1000 */
int *thing_ptr; /* la variabile puntatore thing_ptr punta ad un indirizzo casuale
* DEVE ESSERE INIZIALIZZATA ad un indirizzo valido
*/
thing_ptr = &thing; /* ora nella locazione di memoria rappresentata da thing_ptr
* c'è il valore 0x1000, cioè l'indirizzo della variabile thing
* ora thing_ptr è inizializzata correttamente,può essere usata
*/
Una volta che abbiamo inizializzato thing_ptr
all'indirizzo di memoria di thing
possiamo accedere (leggere e modificare) il contenuto di thing
attraverso thing_ptr
usando l'operatore *
(operatore di deferenziazione)
Note
L'operazione di accesso alla locazione di memoria di una variabile è detta deferenziazione per questo motivo &
è detto operatore di deferenziazione
Una variabile puntatore può essere pensata come ad una freccia che punta ad una cella di memoria (ad un'altra variabile).
int thing = 5; /* ipotizziamo che l'indirizzo della variabile thing sia 0x1000 */
int *thing_ptr; /* la variabile puntatore thing_ptr punta ad un indirizzo casuale
* DEVE ESSERE INIZIALIZZATA ad un indirizzo valido
*/
thing_ptr = &thing; /* ora nella locazione di memoria rappresentata da thing_ptr
* c'è il valore 0x1000, cioè l'indirizzo della variabile thing
* ora thing_ptr è inizializzata correttamente,può essere usata
*/
int other = *thing_ptr /* accedo al contenuto della variabile puntata da thing_prt cioè
* thing (il suo contenuto è il valore 5 ) e lo copio nella varia
* bile other
* /
*thing_ptr = 6; /* copio il valore 6 nella variabile puntata da thing_ptr (thing) */
#include<stdio.h>
int main(void){
int i = 42, j = 107;
printf("i = %d, &i = %p\n", i, &i);
printf("j = %d, &j = %p\n", j, &j);
getchar();
int *p = &i;
int *q = &j;
printf("*p = %d, p = %p\n", *p, p);
printf("*q = %d, p = %p\n", *q, q);
}
#include<stdio.h>
int main(void){
int i = 42, j = 107;
printf("i = %d, &i = %p\n", i, &i);
printf("j = %d, &j = %p\n", j, &j);
getchar();
int *p = &i;
int *q = &j;
printf("*p = %d, p = %p\n", *p, p);
printf("*q = %d, p = %p\n", *q, q);
// p = q; // (1)
// *p = *q;// (2)
// *p = q; // (3)
// p = *q; // (4)
}
Abbiamo detto che prima di essere usati (deferenziazione) per accedere alla memoria i puntatori devono essere inizializzati ad un indirizzo valido altrimenti il programma potrebbe crashare o avere comportamenti imprevisti e difficili da indiduare. Vediamo un esempio
#include<stdio.h>
int main(void){
int i; /* i non è inizializzata, è locale quindi avrà un valore sporco (casuale) */
int *p; /* anche p non è inizializzato, punta ad una cella a caso, deve essere
* inizializzato prima di essere usato con l'operatore di deferenziazione
* *p
*/
printf("i = %d\n", i); /* non possiamo prevedere che valore stamperà */
printf("&i = %p\n", &i);
printf("p = %p\n", p); /* cella di memoria casuale forse appartenete
* ad un altro processo a cui non possiamo mai
* accedere
*/
printf("*p = %d\n", *p); /* accediamo ad una cella di memoria sconosciuta */
}
Il puntatore nullo vale zero e non è un puntatore valido, non può essere utilizzato per un'operazione di derenziazione.
Il valore NULL
è definito tramite macro al preprocessore (#define
) in questo modo:
#define NULL 0
Sfruttando il valore NULL
è possibile identificare un puntatore nullo, NULL
è confrontabile con qualsiasi puntatore.
E' buona norma inizializzare una variabile puntatore a NULL
se la sua inizializzazione valida avverrà successivamente nel codice e controllare se il puntatore è nullo prima di effettuare operazioni di deferenziazione. Vediamo un esempio
#include<stdio.h>
int main(void){
int *p = NULL; /* inizializzo il puntatore p a NULL */
if (p != NULL) /* prima di deferenziare controllo se p e' diverso da NULL */
printf("*p = %d", *p);
}
I puntatori sono variabili che hanno tutte la stessa lunghezza (unsigned long
di solito nelle architetture a 64 bit) fissata dall'architettura (32, 64 bit). Però abbiamo detto che quando dichiariamo una variabile puntatore dobbiamo specificare anche il suo tipo che rappresenta il tipo della variabile puntata.
Questo serve al compilatore per effettuare i calcoli quando si usa l'artimetica dei puntatori. L'aritmetica dei puntatori ci permette di spostarci, usando l'operatore +
, nelle celle di memoria adiacenti a quella puntata dal puntatore.
Vediamo un esempio, se ho tre variabili intere (a
, b
, c
) contingue in memoria (int
occupa 4 byte) ed ho un puntatore (ptr_a
) che punta alla prima variabile (a
) posso accedere ai due interi successivi (b
, c
) rispettiva con ptr_a + 1
(accedo a b
) e ptr_a + 2
(accedo a c).
La sintassi ptr_a + 1
o ptr_a + 2
indica che ci vogliamo spostare dall'indirizzo puntato da ptr_a
di un numero di byte pari alla dimensione di un intero (ptr_a + 1
) o di due interi (ptr_a + 2
) quindi nel nostro caso di interi a 4 byte il compilatore calcola per noi i byte dello scostamento in questo modo
#include<stdio.h>
int main(void){
int a = 1;
int b = 2;
int c = 3;
int *ptr_a = &a;
printf("a = %d\n", *ptr_a);
printf("b = %d\n", *(ptr_a + 1));
printf("a = %d\n", *(ptr_a + 2));
return 0;
}
Come puoi vedere dall'output del programma usando l'artimetica dei puntatori riusciamo ad accedere agli interi (b
e c
) adiacenti alla variabile puntata da ptr_a
(variabile a
)
vagrant@ubuntu2204:/lab/6_pointers$ bin/33_pointers
a = 1
b = 2
a = 3
L'aritmetica dei puntatoti è potentissima, ipotizziamo ora di avere un intero il cui valore sia posto a magic
)
Il numero decimale
Lo stesso valore in esadecimale vale
Il primo byte vale 01, il secondo 02, il terzo 03, quarto 04.
Ora se recupero l'indirizzo di questa variabile e la assegno ad un puntatore ad intero cosa accade se faccio un cast da puntatore ad intero ad un puntaore a carattere? Nulla, il valore dell'indirizzo non cambia ma quando uso l'artimetica dei puntatori per spostarmi con +1
+2
non aumento di 4byte (dimensione di un intero) ma di 1byte (dimensione di un carattere) perchè il tipo del puntatore è cambiato (da int *
a char *)
. Questo mi permettere di spostarmi attraverso i quattro byte del mio intero e di stamparne il valore, come mostrato nel codice di sotto.
#include<stdio.h>
int main(void){o
int magic = 16909060;
int after_magic = 123456789;
printf("magic = %#x\n", magic);
printf("after_magic = %#x\n", after_magic);
int *ptr_magic = &magic;
printf("&magic = %p\n", ptr_magic);
printf("&after_magic = %p\n", &after_magic);
char *ptr_byte1 = (char *)ptr_magic;
char *ptr_byte2 = ptr_byte1 + 1;
char *ptr_byte3 = ptr_byte1 + 2;
char *ptr_byte4 = ptr_byte1 + 3;
printf("ptr_byte1 = %d\n", *ptr_byte1);
printf("ptr_byte2 = %d\n", *ptr_byte2);
printf("ptr_byte3 = %d\n", *ptr_byte3);
printf("ptr_byte4 = %d\n", *ptr_byte4);
return 0;
}
Nell'output del programma, mostrato sotto, è interessante notare come siamo in configurazione big endian perchè l'indirizzo più alto (ptr_a + 4
) è assegnato al byte MSB (quello più a sinistra, che contiene il valore 01)
vagrant@ubuntu2204:/lab/6_pointers$ bin/4_pointers
magic = 0x1020304
after_magic = 0x75bcd15
&magic = 0x7fff5ff87eb8
&after_magic = 0x7fff5ff87ebc
ptr_byte1 = 4
ptr_byte2 = 3
ptr_byte3 = 2
ptr_byte4 = 1
L'artimetica dei puntatori ci sarà molto utile quando lavoreremo con i vettori (array).
I vettori (o array) permettono di allocare un insieme di elementi dello stesso tipo in una zona contingua di memoria. La sintassi per dichiarare un array è la seguente:
nome-tipo identificatore[cardinalità];
nome-tipo
è un tipo di dato predefinito o derivatoidentificatore
è il nome del vettore con cui si accede ai suoi elementicardinalità
è una costante che indica il numero degli elementi
Per esempio, per dichiarare un vettore di interi di dieci elemetni
int vettore[10];
Per accedere ai singoli elmenti di un vettore (operazione di indicizzazione) basta indicare tra le parentesi quadre ([
]
) l'indice del vettore a cui si vuole accedere.
Il primo elemento di un vettore ha indice zero quindi nel nostro esempio avremo:
vettore[0] = 1 // il primo elemento di un vettore ha indice 0, lo inizializzo al valore 1
vettore[1] = 2 // secondo elemento (indice 1), inizializzato al valore 2
vettore[2] = 3
vettore[9] = 10 // ultimo elemento del vettore, assume valore 10
Important
Limiti indicizzazione di un vettore Dato un vettore di cardinalità N (N elementi contigui in memoria) il primo elemento avrà indice 0, l'ultimo elemento avrà indice N - 1. Se si accede oltre il limite massimo il comportamento del programma è indefinito quindi non bisogna mai accedere un cella di memoria oltre il limite dell'indice massimo.
Important
** Nome del vettore Il nome (identificatore) di un vettore contiene l'indirizzo del primo elemento del vettore, in particolare è un puntatore costante al primo elemento del vettore. Questo vuol dire che per accedere all'elemento i-esimo entrambe le sintassi di sotto sono lecite
#include<stdio.h>
int main(void){
int vettore[5];
/* inizializzo gli elementi del vettore con un ciclo */
for(int i=0; i < 5; i++)
vettore[i] = i;
/* accedo agli elementi del vettore tramite [] */
for(int i=0; i < 5; i++)
printf("%d ", vettore[i]);
printf("\n");
/* accedo agli elementi del vettore tramite aritemetica puntatori */
for(int j=0; j < 5; j++)
printf("%d ", *(vettore + j));
printf("\n");
}
Possiamo inizializzare esplicitamente tutti gli elementi di un vettore in questo modo:
#include<stdio.h>
int main(void){
int vettore[5];
vettore[0] = 1;
vettore[1] = 2;
vettore[2] = 3;
vettore[3] = 4;
vettore[4] = 5;
for(int i=0; i < 5; i++)
printf("%d ", vettore[i]);
printf("\n");
return 0;
}
possiamo anche non esplicitare la cardinalità (parentesi quadre vuote) nella dichiarazione che verrà allora dedotta dal numero dei valori specificati nell'inizializzazione
#include<stdio.h>
int main(void){
int vettore[] = {1, 2, 3, 4, 5};
for(int i=0; i < 5; i++)
printf("%d ", vettore[i]);
printf("\n");
return 0;
}
Se vogliamo inizializzare tutti gli elementi del vettore allo stesso valore possiamo usare questa sintassi
#include<stdio.h>
int main(void){
int vettore[5] = {0};
for(int i=0; i < 5; i++)
printf("%d ", vettore[i]);
printf("\n");
return 0;
}
Spesso nella dichiarazione di un vettore si usa la direttiva #define
per specificare la cardinalità del vettore come mostrato nel codice di sotto.
Come puoi vedere se dovessi cambiare la cardinalità non dovrei modidificare la riga della dichiarazione e quella del ciclo ma solamente la riga con la direttiva #define
#include<stdio.h>
#define N 5
int main(void){
int vettore[N] = {0};
for(int i=0; i < N; i++)
printf("%d ", vettore[i]);
printf("\n");
return 0;
}
Verifichiamo che gli elementi di un vettore siano effettivamente contigui stampando gli indirizzi dei singoli elementi. Per farlo sfruttiamo il fatto che il nome (identificatore) del vettore rappresenta l'indirizzo del primo elemento del vettore.
#include<stdio.h>
#define N 5
int main(void){
int vettore[N] = {0, 1, 2, 3, 4};
for(int i=0; i < N; i++)
printf("%d\t\t\t", vettore[i]);
printf("\n");
for(int j=0; j < N; j++)
printf("%p\t\t", vettore + j);
printf("\n");
return 0;
}
Questo è l'output prodotto dal codice di sopra:
vagrant@ubuntu2204:/lab/7_array$ bin/4_array
0 1 2 3 4
0x7fff64c62430 0x7fff64c62434 0x7fff64c62438 0x7fff64c6243c 0x7fff64c62440
Un intero occupa quattro byte sulla mia macchina (ricorda che puoi sempre usare sizeof(int)
).
Abbiamo visto come l'operatore sizeof
ci permetta di conoscere il numero di byte occupati da una variabile o di un tipo di dato. Possiamo sfruttare questo operatore per conoscere il numero di elementi di un vettore a tempo di esecuzione svolgendo semplicemente la divisione tra il numero di byte totali occupati dal vettore ed il numero di byte occupati dal singolo elemento del vettore (ricordiamo che gli elementi di un vettore sono tutti dello stesso tipo ed allocati in celle contigue in memoria).
#include<stdio.h>
#define NUM_ELEM 100
int main(void){
int array[NUM_ELEM] = {0};
unsigned int num_byte_array = sizeof(array); /* n. di byte occupati dall'intero verrore (100*4) */
unsigned int num_byte_int = sizeof(int); /* n. di byte occupati da un intero in questa arch */
unsigned int n_elem = num_byte_array / num_byte_int;
printf("Il vettore di interi occupa %d byte\n", num_byte_array);
printf("Un singolo intero occupa %d byte\n", num_byte_int);
printf("Il vettore ha %d(byte)/%d(byte) = %d elementi\n", num_byte_array, num_byte_int, num_byte_array/num_byte_int);
return 0;
}
vagrant@ubuntu2204:/lab/7_array$ bin/5_array
Il vettore di interi occupa 400 byte
Un singolo intero occupa 4 byte
Il vettore ha 400(byte)/4(byte) = 100 elementi
Volendo è possibile definire una macro da usare ogni volta che è necessario calcolare il numero di elementi di un array, sfruttando il fatto che il nome del vettore è un puntatore costante al primo elemento del vettore:
#define ARRAY_SIZE(x) sizeof(x)/sizeof(*x)
#include<stdio.h>
#define NUM_ELEM 100
#define ARRAY_SIZE(x) sizeof(x)/sizeof(*x)
int main(void){
int array[NUM_ELEM] = {0};
unsigned int num_byte_array = sizeof(array); /* n. di byte occupati dall'intero verrore (100*4) */
unsigned int num_byte_int = sizeof(int); /* n. di byte occupati da un intero in questa arch */
unsigned int n_elem = ARRAY_SIZE(array);
printf("Il vettore di interi occupa %d byte\n", num_byte_array);
printf("Un singolo intero occupa %d byte\n", num_byte_int);
printf("Il vettore ha %d(byte)/%d(byte) = %d elementi\n", num_byte_array, num_byte_int, num_byte_array/num_byte_int);
return 0;
}
Abbiamo detto che il nome di un array è un puntatore costante al primo elemento del vettore.
Quello che non abbiamo detto che i puntatori come gli array possono essere indicizzati con le parentesi [
]
esattamente come i vettori.
La differenza tra nome di un array e puntatori è che il primo è un puntatore costante quindi non è possibile fare le operazione seguenti:
#define N 300
int main(void){
int a[N] = {1};
int *p;
a = p; // errore: a è un puntaore costante, non lo posso cambiare assegnando un altro indirizzo
p = a++; // errore: a è un puntaore costante, non lo posso incrementare con operatore ++ ma (a+1) ok
p = &a; // errore: a è un puntaore costante, non posso accedere al suo indirizzo
}
#include<stdio.h>
#define N 300
int main(void){
int a[N];
for(int j=0; j < N; j++)
a[j] = 1;
int *p = NULL;
int i = 0;
p = a; // equivalente a: p = &a[0]
/*
* array e puntatori sono simili:
* - posso usare aritmetica puntatori con nome array
* - posso usare indicizzazione array con puntatori
* quindi le espressioni di sotto sono tutte lecite
* *(a + 1) // aritmetica puntatori con nome array
* a[i] // indicizzazione array con nome array
* p[i] // indicizzazione array con puntatore
* *(p +1) // aritemetica puntatori con puntatore
*/
int risultato = 0;
/* ciclo il vettore usando l'indicizzazione dei vettore sul nome del vettore */
for(i = 0; i < N; i++)
risultato += a[i];
printf("%d\n", risultato);
/* ciclo il vettore uando l'artmetica dei puntatori sul puntatore*/
risultato = 0;
for(p = a; p < &a[N]; p++)
risultato += *p;
printf("%d\n", risultato);
/* ciclo il vettore usando l'aritmetica dei puntatori sul nome del vettore */
risultato = 0;
for(i=0; i < N; i++)
risultato += *(a + i);
printf("%d\n", risultato);
/* ciclo il vettore usando l'indicizzazione dei vettori sul puntatore */
risultato = 0;
p = a;
for(i=0; i < N; i++)
risultato += p[i];
printf("%d\n", risultato);
return 0;
}
vagrant@ubuntu2204:/lab/6_pointers$ bin/7_pointers
300
300
300
300
#include<stdio.h>
int main(void){
int a[2], *p, *q;
printf("(int ) %ld bytes\n", sizeof(int));
printf("(long ) %ld bytes\n", sizeof(long));
printf("(int *) %ld bytes\n", sizeof(int *));
printf("\n");
/* La differenza tra due puntatori ritorna il numero di elementi
* che li separa e NON il numero di byte come ci si aspetterebbe
* devi fare un cast per ottenere il risultato atteso
*/
p = a;
q = a + 1; // equivalente a: q = p + 1, q = &a[1]
printf("%ld\n", q - p); // %ld -> long int, un puntatore è di tipo long int (arch a 64 bit)
printf("%ld\n", (long)q - (long)p);
printf("\n");
/* questi vale anche se le variabili puntate non sono elementi di un array */
int b = 2;
int c = 1;
int d = 3;
q = &d;
p = &b;
printf("&b = %p\n", p);
printf("&c = %p\n", &c);
printf("&d = %p\n", q);
printf("%ld\n", q - p); // distanza in elementi in memoria
printf("%ld\n", (long)q - (long)p); // distanza in termini di byte
}
vagrant@ubuntu2204:/lab/6_pointers$ bin/8_pointers
(int ) 4 bytes
(long ) 8 bytes
(int *) 8 bytes
1
4
&b = 0x7fff570affa4
&c = 0x7fff570affa8
&d = 0x7fff570affac
2
8
Il linguaggio C non ha un tipo predefinito per le stringhe, queste vengono implementate come array di caratteri.
Una stringa in C deve essere racchiusa tra doppi apici: "
in questo modo
"Questa è una stringa"
Una costante stringa come quella di sopra è tratta dal compilatore come un puntatore a carattere quindi per assegnare una costante stringa ad una variabile abbiamo due possibilità. La prima è dichiarare un array di catteri sufficientemente capiente per contenere tutti i caratteri della stringa. Tutte le stringhe vengono terminate (ultimo elemento della stringa) dal carattere \0
detto di fine stringa che ovviamente non è stampabile ma serve per delimitare la fine della stringa. Nel calcolo della dimensione del vettore di carattere che conterrà la stringa dobbiamo quindi tenere conto del \0
ed aumentare la dimenisone di 1 per esempio: la stringa "ciao" è composta da quattro caratteri, dobbiamo dichiarare un array di 5 caratteri per ospitare anche il carattere \0
, in questo modo:
Note
Il carattere di fine stringa \0
è diverso dal catattere '0' (il valore in ACII del carattere '0' è 48). \0
in ASCII ha valore 0.
#include<stdio.h>
int main(void){
char ciao[5] = "ciao";
for(int i=0; i < 5; i++)
printf("%c \t", ciao[i]);
printf("\n");
for(int i=0; i < 5; i++)
printf("%d \t", ciao[i]);
printf("\n");
return 0;
}
vagrant@ubuntu2204:/lab/8_strings$ bin/0_strings
c i a o
99 105 97 111 0
Caution
I doppi apici "
devono essere utilizzati per le stringhe, i singoli apici '
per i caratteri. Fai attenzione a non scambiare i simboli tra loro.
Un altra possibilità per assegnare una costante stringa ad una variabile è quella di utilizzare una variabile di tipo puntatore a carattere char *
in questo modo:
#include<stdio.h>
int main(void){
char *ciao = "ciao";
for(int i=0; i < 5; i++)
printf("%c \t", ciao[i]);
printf("\n");
for(int i=0; i < 5; i++)
printf("%d \t", ciao[i]);
printf("\n");
return 0;
}
vagrant@ubuntu2204:/lab/8_strings$ bin/1_strings
c i a o
99 105 97 111 0
In questo modo non ci dobbiamo preoccupare di tenere conto del carattere di fine stringa \0
.
Abbiamo visto che c'è una relazione tra array e puntatori, il compilatore infatti ci permette di dichiarare una stringa anche usando un array con le parentesi quadre vuote in questo modo:
#include<stdio.h>
int main(void){
char ciao[] = "ciao";
for(int i=0; i < 5; i++)
printf("%c \t", ciao[i]);
printf("\n");
for(int i=0; i < 5; i++)
printf("%d \t", ciao[i]);
printf("\n");
return 0;
}
vagrant@ubuntu2204:/lab/8_strings$ bin/2_strings
c i a o
99 105 97 111 0
Anche in questo caso possiamo scordarci di \0
.
Anche se esistono due modi diversi per dichiarare una stringa (il primo pensandola come un array di carattere e il secondo pensandola come un literals puntato da un puntatore a carattere) esistono delle differenza sottili tra i due metodi che vanno oltre il non doversi preoccupare di allocare spazio per '\0'. Vediamole in questo esempio:
#include<stdio.h>
#include<string.h>
int main(void){
char ciao[] = "ciao";
/* Il nome di un array e' un putatore costante al primo elemento del vettore
* non posso farlo puntatore ad un'altro indirizzo, si ottiene un errore:
* error: assignment to expression with array type
*/
//ciao = "miao";/* errore: ciao e' puntaore costante */
/* Il puntatore non può essere modificato ma i caratteri ovviamente si come
* singoli elementi del vettore oppure usando la strcpy()
*/
ciao[0] = 'm'; // corretto
printf("%s\n", ciao); // (1) miao
strcpy(ciao, "ciao");
printf("%s\n", ciao); // (2) ciao
printf("\n");
/* Se assegno la stringa ad un puntatore a carattere posso far puntare ciao_
* ad un' altra cella di memoria senza problemi perche' il puntatore non e'
* const
*/
char *ciao_ = "ciao";
printf("%s\n", ciao_); // (3) ciao
ciao_ = "miao";
printf("%s\n", ciao_); // (4) miao
/* In questo caso *ciao_ punta alla stringa "ciao" e di solito il compilatore
* inserisce le stringhe in un'area di memoria a sola lettura quindi probabil
* mente tentare di modificare la stringa con indicizzazione o strcpy porta
* al crash del programma (segmentation fault)
*/
strcpy(ciao_, "ciao");
printf("%s\n", ciao_); // (5) ciao
ciao_[0] = 's';
printf("%s\n", ciao_); // (6) siao
}
vagrant@ubuntu2204:/lab/8_strings$ bin/5_strings
miao
ciao
ciao
miao
Segmentation fault (core dumped)
Fare un ciclo for
per stampare carattere dopo carattere tutti gli elementi della stringa (come fatto sopra) non è una grande idea, per stampare una stringa basta usare %s
con la funzione printf()
passando l'indirizzo base della stringa (l'indirizzo del primo carattere).
#include<stdio.h>
int main(void){
char ciao_v1[5] = "ciao"; // vettore dimensione fissa (+1 per '\0')
char *ciao_v2 = "ciao"; // puntatore a carattere
char ciao_v3[] = "ciao"; // vettore dimensine dedotta dal numero di caratteri
printf("%s\n", ciao_v1);
printf("%s\n", ciao_v2);
printf("%s\n", ciao_v3);
printf("%s\n", "ciao");
return 0;
}
vagrant@ubuntu2204:/lab/8_strings$ bin/4_strings
ciao
ciao
ciao
ciao
Quando un certo numero di istruzioni vengono usate più volte nel codice, piuttosto che copiarle ed incollarle in tutte le parti dove ne abbiamo bisogno, è preferibile raggrupparle in una funzione. Una funzione è una porzione di codice che può essere richiamata in qualsiasi parte del programma e di solito raggruppa le istruzioni che cooperano per svolgere un certo compito. Ogni funzione ritorna uno ed un solo valore (di solito un intero che informa circa il successo o meno delle operazioni svolte oppure direttamente il risultato dell'operazione) e riceve una serie di parametri in ingresso (può anche non accettare alcun parametro in ingresso se non ne ha bisogno). Una funzione ha questa forma:
tipo-valore-ritorno nome-funzione(tipo-parametro-1 nome-parametro-1, ..., tipo-parametro-N nome-parametro-N){
istruzione1;
...
return valore-di-ritorno;
}
La prima riga esclusa la parentesi graffa aperta {
è detta prototipo della funzione
tipo-valore-ritorno nome-funzione(tipo-parametro-1 nome-parametro-1, ..., tipo-parametro-N nome-parametro-N)
In realtà il nome dei paraemtri in ingresso è opzionale, quindi il prototipo di sotto (più compatto) è comunque corretto
tipo-valore-ritorno nome-funzione(tipo-parametro-1, ..., tipo-parametro-N)
Specificare i nomi dei parametri aiuta chi legge il codice a comprendere il tipo di operazioni che la funzione svolge, è cosa buona e giusta aggiugerli nella dichiarazione della funzione (nel prototipo)
Important
Prototipo di funzione: consiste nel tipo di ritorno, nel nome della funzione e nella lista dei tipi dei parametri in ingresso (se presenti)
tutto il codice compreso tra le parentesi graffe {
}
è il corpo (body) della funzione:
{
istruzione1;
...
return valore-di-ritorno;
}
Quindi se ho questa funzione
int differenza(int minuendo, int sottraendo)
{
return minuendo - sottraendo;
}
questo è il suo prototipo
int differenza(int minuendo, int sottraendo)
o in forma compatta
int differenza(int, int)
questo è il suo corpo
{
return minuendo - sottraendo;
}
Le funzioni possono essere dichiarate e definite.
La dichiarazione è opzionale e non prevede che si specifichino le istruzioni che compongono la funzione ma solo il suo prototipo. La dichiarazione serve solo per informare il compilatore circa l'esistenza di una certa funzione da qualche altra parte nel codice sorgente. In questo modo quando il compilatore incontrerà una chiamata alla funzione avrà (grazie alla dichiarazione che precede la cihamata) le informazioni necessaria per verificare la correttezza della chiamata (i parametri sono dei tipi attesi, nel numero corretto, il valore di ritorno coincide con quello nel prototipo, etc). Ovviamente la dichiarazione della funzione deve sempre precedere la prima invocazione della funzione stessa. La definizione (che vedremo sotto) può essere inserita in qualunque punto del codice sorgente. La dichiarazione è il prototipo della funzione.
Le funzioni possono non accettare al parametro in ingresso o non restituire alcun valore di ritorno. Per informare di questo il compilatore si uso il tipo void
. Per esempio
Questa funzione non ritorna nulla:
void stampa(char *stringa){
pritnf("%s\n", stringa);
}
Questa non accetta alcun parametro in ingresso
char *saluta(void){
return "ciao"
}
La definizione di funzone include il prototipo e le istruzioni che formano il corpo della funzione. Una definizione di funzione può comparire solo una volta nel codice sorgente. La definizione di funzione termina quando viene eseguita l'ultima istruzione o quando viene incontrata l'istruzione return
. Quando l'istruzione termina, il programma prosegue dall'istruzione successiva alla chiamata della funzione appena terminata. Lo scopo dell'istruzione return
è quella di specificare il valore di ritorno della funzione.
Una funzione può anche avere un corpo vuoto:
void do_nothing(void){
}
Caution
Un programma in linguaggio C deve almeno contenere la definizione della funzione main() da cui inizia l'esecuzione del programma
La chiamata di una funzione (invocazione di funzione) è l'operazione con lal quale si richiama l'esecuzione della funzione stessa. E' possibile richiamare 0 o N volte una funzione in un qualunque punto del programma. Ogni volta che la funzione viene invocata, l'esecuzione del programma si sposta dal punto di invocaione alla prima istruzione del corpo della funzione. Quando una funzione termina la propria esecuzione, il flusso di esecuzione ritorna al punto in cui la funzione era stata invocata e continua ed eseguire l'istruzione successiva. Vediamo un esempio:
#include<stdio.h>
#define ESPONENTE 16
int potenza_di_due(int esponente); /* prototipo o dichiarazione di funzione */
int main(void){
/* stampo potenze del 2 con esponente da 0 a 16 */
for(int i=0; i < ESPONENTE + 1; i++){
int risultato = potenza_di_due(i); /* invocazione funzione */
printf("2^(%d)\t = %d\n", i, risultato);
}
return 0;
}
/* definizione di funzione */
int potenza_di_due(int esponente){
int risultato = 1;
for(int i=1; i <= esponente; i++)
risultato *= 2;
return risultato;
}
vagrant@ubuntu2204:/lab/9_functions$ bin/0_functions
2^(0) = 1
2^(1) = 2
2^(2) = 4
2^(3) = 8
2^(4) = 16
2^(5) = 32
2^(6) = 64
2^(7) = 128
2^(8) = 256
2^(9) = 512
2^(10) = 1024
2^(11) = 2048
2^(12) = 4096
2^(13) = 8192
2^(14) = 16384
2^(15) = 32768
2^(16) = 65536
I parametri di ingresso di una funzione sono passati sempre per valore: la funzione utilizza una nuova variabile (nello stack della funzione) per immagazzinare una copia del valore contenuto nella variabile passata come parametro in ingresso alla funzione dal chiamante. Anche se dentro la funzione il valore passato in ingresso alla funzione viene alterato (incremento/decremento etc) siccome questo valore è stato copiato in una variabile diversa rispetto a quella passata come in ingresso dal chiamante, il valore nella variabile del chiamante rimane inalterato; sarà modificato il valore nella variabile (nuova) allocata nello stack della funzione quando questa è stata invocata.
Important
Le variabili allocate all'interno di una funzione sono locali alla funzione. La memoria per queste variabili viene allocata solo al momento dell'invocazione della funzione e questa memoria è accessibile solo all'interno della funzione. Quando la funzione termina la memoria viene completamente deallocata. Questa porzione di memria usata per variabili locali delle funzioni è detta stack. Lo stack cresce verso il basso: l'allocazione della memoria sullo stack avviene partendo dagli indirizzi più alti verso gli indirizzi più bassi. La deallocazione della memoria sullo stack avviene partendo dall'ultimo elemento allocato fino al primo procedendo quindi in ordine inverso rispetto all'ordine di allocazione. Lo stack viene utilizzato per memorizzare l'indirizzo di ritorno della funzione (l'indirizzo dell'istruzione successiva del chiamante), il valore dei parametri di ritorno e dei parametri in ingresso alla funzione e per allocare la memoria per tutte le variabili locali della funzione stessa. Lo spazio sullo stack per la funzione viene allocato al momento dell'invocazione della fuznione e deallocata al termine della sua esecuzione (ultima istruzione della funzione o chiamata a return
).
Cechiamo di capire con un esempio:
#include<stdio.h>
int incrementa(int, int); /* prototipo */
int main(void){
int valore = 100; /* valore iniziale di partenza */
printf("valore = %d, &valore = %p\n\n", valore, &valore);
printf("valore prima dell'invocazione: %d\n\n", valore);
/* quando la funzoine incremanta() viene invocata, il contenuto della variabile di nome valore
* viene copiato all'interno della variabile valore_f ( primo parametro in input nel prototipo
* della funzione). Il valore contenuto in questa nuova variabile puo' essere modificato ma è
* una copia del valore della variabile orginale nel chiamante. Quest'ultimo dunque non subisce
* alcuna variazione perchè si trova in un'altra variabile in memoria.
*/
int risultato = incrementa(valore, 3); /* incremento il valore di iniziale di 3 */
printf("\n");
printf("valore dopo l'invocazione: %d\n", valore);
printf("risultato : %d\n", risultato);
}
int incrementa(int valore_f, int iterazioni){
printf("************incrementa****************\n");
for(int i=0; i<iterazioni; i++){
valore_f++;
printf("i=%d valore_f = %d, &valore_f = %p\n", i, valore_f, &valore_f);
}
printf("************incrementa****************\n");
return valore_f;
}
vagrant@ubuntu2204:/lab/9_functions$ bin/1_functions
valore = 100, &valore = 0x7ffef9659030
valore prima dell'invocazione: 100
************incrementa****************
i=0 valore_f = 101, &valore_f = 0x7ffef965900c
i=1 valore_f = 102, &valore_f = 0x7ffef965900c
i=2 valore_f = 103, &valore_f = 0x7ffef965900c
************incrementa****************
valore dopo l'invocazione: 100
risultato : 103
Se si vuole modificare il valore della variabile del chiamante, bisogna passare alla funzione l'indirizzo della variabile (usando una variabile puntatore) del chiamante da modificare. Ovviamente il passaggio dell'indirizzo dal chiamante alla funzione è fatto per copia: cioè l'indirizzo della variabile del chiamante è copiato all'interno una nuova variabile di tipo puntatore ma avendo a disposizione l'indirizzo della variabile del chiamante la funzione potrà (attraverso la deferenziazione) acccedere al reale valore della variabile originale.
Per ottenere un passaggio per indirizzo nel codice precedente dobbiamo trasformare il primo parametro della funzione (variabile valore_f
) da int
a int *
rendondola un puntatore pronta ad aspitare l'indirizzo della variabile valore
(la variabile del chiamante da modificare). Per modificare all'interno della funzione il valore della variabile valore
basterà usare la deferenziazione sul puntatore valore_f
in questo modo *valore_f
di fatto accedendo alla locazione di memoria riservata alla variabile valore
.
Sotto il codice modificato:
#include<stdio.h>
int incrementa(int *, int); /* prototipo */
int main(void){
int valore = 100; /* valore iniziale di partenza */
printf("valore = %d, &valore = %p\n\n", valore, &valore);
printf("valore prima dell'invocazione: %d\n\n", valore);
/* In questo passiamo l'indirizzo della variabile valore e lo capiamo dentro
* una variabile puntatore ad intero locale alla funzione ( primo parametro
* in ingresso della funzione incrementa). Dentro la funzione dereferenziamo
* il puntatore accedendo effettivamente alla locazione di memoria della vari
* abile valore del chiamante modificando di fatto il valore originale.
*/
int risultato = incrementa(&valore, 3); /* incremento il valore di iniziale di 3 */
printf("\n");
printf("valore dopo l'invocazione: %d\n", valore);
printf("risultato : %d\n", risultato);
}
int incrementa(int *valore_f, int iterazioni){
printf("************incrementa****************\n");
for(int i=0; i<iterazioni; i++){
(*valore_f)++;
printf("i=%d valore_f = %d, &valore_f = %p\n", i, *valore_f, valore_f);
}
printf("************incrementa****************\n");
return *valore_f; /* superfluo */
}
vagrant@ubuntu2204:/lab/9_functions$ bin/2_functions
valore = 100, &valore = 0x7ffef6f854a0
valore prima dell'invocazione: 100
************incrementa****************
i=0 valore_f = 101, &valore_f = 0x7ffef6f854a0
i=1 valore_f = 102, &valore_f = 0x7ffef6f854a0
i=2 valore_f = 103, &valore_f = 0x7ffef6f854a0
************incrementa****************
valore dopo l'invocazione: 103
risultato : 103
Important
L'utilizzo della tecnica del passaggio di parametri per indirizzo permette al programmatore di:
- ritornare più di una valore da una funzione
- evitare di perdere tempo nella copia di dati di grandi dimensioni passando solo l'indirizzo e non il dato completo
Quando è necessario passare dati di grandi dimensioni ad una funzione è quindi cosa buona e giusta passare solo il puntatore al dato (tramite variabile puntatore: passaggio per indirizzo). Abbiamo visto che passando il puntatore di una variabile ad una funzione applichiamo un passaggio per indirizzo ed il dato originale nel chiamante è di fatto modificabile dalla funzione che lo riceve. Se non vogliamo che la funzione sia in grado di modificare il dato passato per indirizzo attraverso la deferenziazione del puntatore possiamo dichiarare il puntatore const nel prototipo della funzione rendendo di fatto il dato a sola lettura dentro la funzione. Vediamo un esempio:
#include<stdio.h>
void leggi(const char *);
int main(void){
char qualcosa[30] = "Non voglio essere modificata";
qualcosa[0] = 'x';
qualcosa[1] = 'x';
qualcosa[2] = 'x';
leggi(qualcosa);
}
void leggi(const char *qualcosa){
// qualcosa[0] = '\0';
/* Se decommenti la riga sopra e provi a ricompilare ottineni errore
* error: assignment of read-only location *qualcosa
* perchè stai provando a modificare una locazione di memoria in sola
* lettura (puntatore costante)
*/
printf("%s\n",qualcosa);
}
vagrant@ubuntu2204:/lab/6_pointers$ bin/5_pointers
xxx voglio essere modificata
In una definizione di funzione, un parametro in ingresso dichiarato come array è in realtà un puntatore. Quindi, quando un array viene passato ad una funzione, viene fatto un passaggio per valore dell'indirizzo del primo elemento dell'array; gli elementi degli array non vengono mai copiati. Per convenienza notaionale, il compilatore permette l'utilizzo della notazione con le parentesi quadre (vuote) degli array per dichiarare parametri di tipo puntatore. Vediamo un esempio:
#include<stdio.h>
#define N 100
int sum(int a[], int dim);
int somma(int *, int dim);
int main(void){
int vettore[N];
for(int i=0; i < N; i++)
vettore[i] = 1;
printf("%d\n", sum(vettore, N));
printf("%d\n", somma(vettore, N));
return 0;
}
int sum(int a[], int dim){
int risultato = 0;
for(int i=0; i < dim; i++)
risultato += a[i];
return risultato;
}
int somma(int *a, int dim){
int risultato = 0;
for(int i=0; i < dim; i++)
risultato += a[i];
return risultato;
}
vagrant@ubuntu2204:/lab/9_functions$ bin/3_functions
100
100
Quando si dichiara una variabile, il compilatore alloca automaticamente lo spazio in memoria necessario per memorizzare la variabile. La quantità di spazio allocato dipende dal tipo della variabile. Quando si dichiara un puntatore ad un determinato tipo, viene allocato spazio in memoria per il puntatore soltanto (che è sempre la stessa unsisgned long
8byte) indipendentemente dalla dimensione del tipo puntato. Il puntatore potrà successivamente essere assegnato per contenere l'indirizzo di una variabile dello stesso tipo del puntatore e da quel momento si potrà utilizzare il puntatore per accedere al contenuto della variabile passando per il suo indirizzo (usando l'operazione di derenziazione dei puntatori che abbiamo studiato).
Questo tipo di allocazione della memoria avviene a tempo di compilazione ed è spesso detta allocazione statica della memoria. L'allocazione statica può risultare inutile soprattutto nel caso dei vettori se la dimensione (il numero di elementi del vettore) non è noto a tempo di compilazione ma solo durante l'esecuzione del programma (ad esempio il numero degli elementi è scelto dall'utente ad ogni nuova esecuzione). Il linguaggio C permette di effettuare l'allocazione di memoria a tempo di esecuzione; questo tipo di allcoazione è detta: allocazione dinamica della memmoria.
Esistono diverse funzioni offerte dal libreria standard del C, per allocare dinamicamente la memoria a tempo di esecuzione. Per adesso vediamo la più comune: la funzione malloc().
Questo è il suo prototipo:
void * malloc(size_t n);
La funzione malloc()
alloca n byte contigui in memoria e ritorna in caso di successo il puntatore al primo elemento della memoria allocata o in caso di errore NULL
.
size_t n
: n è il numero di byte da allocare contigui in memoriavoid *
: ritorna un puntatore a void (che può essere trasformato in un puntatore di qualsiasi tipo) che punta al primo elemento della memoria contigua allocata
Tornando NULL
in caso di errore è cosa buona e giusta, prima di usare la memoria allocata, effettuare un controllo sul puntatore tornato da malloc()
in questo modo:
int *ptr = (int *)malloc(sizeof(int));
if (ptr) {
/* codice che usa ptr ed accede alla memoria allocata*/
}
o anche esplicitamente
int *ptr = (int *)malloc(sizeof(int));
if (ptr != NULL) {
/* codice che usa ptr ed accede alla memoria allocata*/
}
Caution
Tutta la memoria allocata dinamicamente deve essere rilasciata quando non più necessaria. A questo scopo si richiama la funzione free() che accetta come parametro un puntatore contenente la memoria da deallocara
Chiamare free() su un puntatore non allocato o precedentemente deallocato può portare a comportamenti del programma imprevedibili. Chiamare free() su un puntatore nullo (NULL
) non ha alcun effetto.
#include<stdio.h>
#include<stdlib.h>
#define N 10
int main(void){
/* allocazione statica a tempo di compilazione, la dimensione del vettore
* deve essere nota a tempo di compilazione e non puo' essere modificata
* successivamente durante l'esecuzione del programma.
*/
int statico[N];
for(int i=0; i<N; i++)
statico[i] = i;
/* allocazione dinamica a tempo di esecuzione, possiamo definire la dimen
* sione del vettore a durante l'esecuzione del programma ad esempio chie
* dendo all'utente il numero di elementi del vettore
*/
int M = 0;
printf("Quanti elementi per il vettore?\n");
scanf("%d", &M);
/* malloc alloca n byte contigui in memoria e ritorna l'indirizzo del primo
* byte relativo allo spazio allocato.Nota come la variabile dinamico e' un
* puntaore ma nel ciclo posso usare l'indicizzazione come fosse un vettore
*/
int *dinamico = (int *) malloc(M * sizeof(int));
/* dinamico e' un puntatore*/
for(int j=0; j<M; j++)
dinamico[j] = j;
int k;
printf("statico : ");
for(k=0; k<N; k++)
printf("%d ", statico[k]);
printf("\n");
printf("dinamico: ");
for(k=0; k<M; k++)
printf("%d ", dinamico[k]);
printf("\n");
/* dealloco la memoria con free() */
free(dinamico);
return 0;
}
vagrant@ubuntu2204:/lab/10_dynamic_memory$ bin/0_malloc
Quanti elementi per il vettore?
15
statico : 0 1 2 3 4 5 6 7 8 9
dinamico: 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14
Gli array sono memorizzati in modo contiguo (linearmente) in memoria ma spesso è utile pensare a vettori a due dimensioni (detti anche matrici) in cui un elmento del vettore a due dimensioni è indentificato da due indici: indice di riga e indice di colonna. La dichiarazione di una matrice prevede quindi due cardinalità per il numero delle righe e per il numero delle colonne.
nome-tipo identificatore [ cardinalita-riga] [cardinalita-colonna]
Per esempio per allocare spazio per una matrice con 6 righe e 7 colonne dovremmo fare:
int mat[6][7];
Come puoi vedere nella figura di sopra anche se da un punto di vista di indicizzazione mat
ha due indici quindi è bidimensionale in memoria lo spazio allocato è lineare e continguo (la RAM ha una struttura monodimensionale): viene allocato spazio contiguo per 42 interi.
Rimane la relazione tra array e puntatori, il nome della matrice è un puntatore doppio (punta ad un puntatore) cioè se faccio la deferenziazione *mat
non ottengo il valore del primo elemento del vettore contingue di 42 elementi ma l'indirizzo del primo elemento del vettore contiguo in RAM; usando l'aritmetica dei puntatori a partire da questo indirizzo mi sposto tra i vari elementi.
Per esempio data una matrice di N_RIGHE=6
e N_COLONNE=7
: mat[6][7]
sia i
l'indice di riga e j
l'indice colonna, per accedere al 21° elemento (ultimo elemento della terza riga) quindi i=2
(gli indici partono sempre da zero, i=0 prima riga, i=2 terza riga) j=6
(settima ed ultima colonna) possiamo usare:
- l'accesso ad indice degli array
mat[i][j]
- l'artimetica dei puntaori
/* * mat è un puntatore doppio: contiene l'indirizzo di una variabile puntatore che continene * a suo volta l'indirizzo del primo elemento del vettore contiguo di 42 elementi. * 1. deferenziazione sul doppio puntatore mat: * *mat * ottengo l'indirizzo del primo elemento del vettore * 2. mi sposto con aritmetica puntatori all'indirizzo del 21 elemento con la formula * *mat + ( (i*N_COLONNE) + j) ) * 3. deferenziazione del puntatore che punta al 21 elemento * *(*mat + ( (i*N_COLONNE) + j) ) ) * e finalmente ottengo il valore del 21 elemento */
#include<stdio.h>
#define N_RIGHE 6
#define N_COLONNE 7
int main(void){
int mat[N_RIGHE][N_COLONNE];
int i; // indice riga
int j; // indice colonna
for(i=0; i<N_RIGHE; i++)
for(j=0; j<N_COLONNE; j++)
mat[i][j] = (i*N_COLONNE) + j;
for(i=0; i<N_RIGHE; i++){
for(j=0; j<N_COLONNE; j++)
printf("%2d ", mat[i][j]);
printf("\n");
}
printf("\n");
/* Gli elementi della matrice sono contigui in memoria e
* posso accedervi senza la notazione ad indici del vett
* ore ma usando l' artimetica dei puntatori, se i e' l'
* indice di riga e j l' indice colonna per accedere al
* k-esimo elemento contigue in memoria basta usare la
* formula k = (i*N_COLONNE) + j
* Per accedere ad esempio all' ultimo elemento della 3°
* riga: k = 20, i=2 (3° riga), j=6 (7° colonna) (ricorda
* che gli indici partono da 0) k=2*7+6=20
*/
for(i=0; i<N_RIGHE; i++)
for(j=0; j<N_COLONNE; j++)
printf("%d ", *(*mat + ( (i*N_COLONNE) + j) ) );
printf("\n");
return 0;
}
vagrant@ubuntu2204:/lab/7_array$ bin/7_array
0 1 2 3 4 5 6
7 8 9 10 11 12 13
14 15 16 17 18 19 20
21 22 23 24 25 26 27
28 29 30 31 32 33 34
35 36 37 38 39 40 41
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41
I puntatori sono variabili come tutte le altre e quindi è possibile dichiare un vettore di puntatori.
#include<stdio.h>
int main(void){
char *mesi_anno[12] = {"Gennaio", "Febbraio", "Marzo", "Aprile", "Maggio", "Giugno", "Luglio",
"Agosto", "Settembre", "Ottobre", "Novembre", "Dicembre"};
int mese;
printf("Inserisci un numero da 1 a 12\n");
scanf("%d", &mese);
printf("%d -> %s\n", mese, mesi_anno[mese-1]);
return 0;
}
vagrant@ubuntu2204:/lab/6_pointers$ bin/9_pointers
Inserisci un numero da 1 a 12
10
10 -> Ottobre
Benchè simili i vettori bidimensionali (matrici) e gli array di puntatori sono diversi.
Riprendendo l'esempio dei mesi dell'anno le due variabili: array_di_puntatori
e matrice
svolono lo stesso identico ruolo: contenere la lista ordinata dei mesi dell'anno
#include<stdio.h>
int main(void){
char *array_di_puntatori[12] = {"Gennaio", "Febbraio", "Marzo", "Aprile", "Maggio", "Giugno", "Luglio",
"Agosto", "Settembre", "Ottobre", "Novembre", "Dicembre"};
char matrice[12][10] = {"Gennaio", "Febbraio", "Marzo", "Aprile", "Maggio", "Giugno", "Luglio",
"Agosto", "Settembre", "Ottobre", "Novembre", "Dicembre"};
int mese;
printf("Inserisci un numero da 1 a 12\n");
scanf("%d", &mese);
printf("%d -> %s\n", mese, array_di_puntatori[mese-1]);
printf("%d -> %s\n", mese, matrice[mese-1]);
return 0;
}
vagrant@ubuntu2204:/lab/6_pointers$ bin/10_pointers
Inserisci un numero da 1 a 12
6
6 -> Giugno
6 -> Giugno
e l'accesso indicizzato array_di_puntatori[5][0]
o matrici[5][0]
è equivalente e permette di leggere la lettera G
(il primo carattere del mese di giugno, primo elemento dell'array in sesta posizione).
Da un punto di vista di allocazione di memoria ci sono delle sottili differenze.
Nel caso di vettore bidimensionale abbiamo allocato una quantità di memoria fissa pari a 1210=120 byte (12 ovviamente sono i mesi, il 10 è dato dalla lunghezza della stringa più lunga: Settembre che misura 9 caratteri più il carattere di fine stringa \0
) quindi abbiamo 12 righe tutte con una lunghezza di 10 colonne. C'è un certo spreco di memoria perchè non tutti i mesi sono lunghi 9 caratteri ed i byte resteranno non utlizzati.
Nel caso di vettori di puntaori invece abbiamo una quantità di memoria allocata pari a 12 puntatori a carattere quindi 128=96 byte, un puntatore doppio che punta al primo elemento del vettore di puntatori quindi 8 byte e più la memoria allocata per ogni singola stringa rappresentante i mesi dell'anno. Questa volta però le stringhe occupano lo spazio strettamente necessario a contenere i loro caratteri senza spreco di spazio e qualche elemento del vettore di puntatori potrebbe anche non contenere alcun indirizzo quindi non puntatore a nulla se fosse necessario.
La differenza sostanziale però tra i due metodi è che nel caso delle matrici gli elementi sono allocati in modo contiguo in memoria mentre in un array di puntatori solo le variabili di tipo puntatorw sono contigue in memoria mentre le variabili puntate sono sparse in memoria; questo secondo approccio si traduce in un grosso vantaggio quando si devono svolgere operazioni di ordinamento e/o spostamento tra i vari elementi se questi ultimo occupano grandi quanità di memoria.
Il vantaggio di un array di puntaori non è tanto il risparmio di memoria nella rappresentazione degli elmenti ma piuttosto il fatto che ordinamenti e spostamenti degli elementi del vettore sono molto più facili e veloci da fare perchè lo scambio di posizione tra due elementi del vettore si traduce nello scrivere dei nuovi indirizzi nelle variabili puntatori mentre nel caso delle matrice dobbiamo spostare tutti gli elementi compresi tra i due elementi interessati.
Nulla vieta di provare ad allocare un array bidimensionale dinamicamente con la funzione malloc()
anche in questo caso avremmo la possibilità di scegliere esattamente la dimensoine dei byte da allocare per ogni singolo elemento come nel caso degli array di vettori, ma non è questo il caso d'uso dell'allocazione dinamica. Vediamo un esempio:
#include<stdio.h> // printf()
#include<stdlib.h> // malloc(), free()
#include<string.h> // strcpy()
int main(void){
char *array_di_puntatori[12] = {"Gennaio", "Febbraio", "Marzo", "Aprile", "Maggio", "Giugno", "Luglio",
"Agosto", "Settembre", "Ottobre", "Novembre", "Dicembre"};
char matrice[12][10] = {"Gennaio", "Febbraio", "Marzo", "Aprile", "Maggio", "Giugno", "Luglio",
"Agosto", "Settembre", "Ottobre", "Novembre", "Dicembre"};
/* array di puntatore a char allocato dinamicamente */
char **matrice_dinamica = (char **) malloc(12*sizeof(char*)); // alloca spazio contiguo per 12 puntatori a char
for(int k=0; k<12; k++)
matrice_dinamica[k] = (char *)malloc(10*sizeof(char)); // alloca spazio contiguoper 10 caretteri
/* Ho allocato spazio per 10 caratteri per tutti i mesi e sto sprecando spazio ma nulla mi impedisce di allocare
* il numero di caratteri strettamente necessario per ogni singolo mese, non avevo voglia di perdere tempo ma e'
* una cosa fattibile ovviamente ed avremmo avuto lo stesso risultato degli array di puntatori solo che l'alloca
* zione in questo caso è dinamica cioe' e' avvenuto a tempo di esecuzione e non statico cioe' a tempo di compil
* azione. Usa l'allocazione dinamica solo quando la dimensine del vettore o della matrice non e' nota se non du
* rante l'esecuzione; in questo caso e' inutile usare l'allocazione dinamica perche' sia la dimensione delle ri
* ghe che delle colonne e' nota prima dell'esecuzione.
*/
/* Questo metodo per inizializzare i vettori di caratteri non va bene se
* e' prevista la deallocazione con free() in quanto gli string literals
* sono allocati nel DATA segment che e' a sola lettura quindi non potra
* nno e non dovranno mai essere deallocate, provare a fare una free() su
* queste variabili e' inutile (non stanno nello stack) e porta ad un seg
* mentation fault in quanto free() provera' ad scrivere in memoria a so
* la lettura
*/
/* decommanta le righe di sotto e commaenta le righe con strcpy() per pro
* vare l'errore di segmentation fault spiegato sopra
*/
/*
matrice_dinamica[0] = "Gennaio";
matrice_dinamica[1] = "Febbraio";
matrice_dinamica[2] = "Marzo";
matrice_dinamica[3] = "Aprile";
matrice_dinamica[4] = "Maggio";
matrice_dinamica[5] = "Giugno";
matrice_dinamica[6] = "Luglio";
matrice_dinamica[7] = "Agosto";
matrice_dinamica[8] = "Settembre";
matrice_dinamica[9] = "Ottobre";
matrice_dinamica[10] = "Novembre";
matrice_dinamica[11] = "Dicembre";
*/
strcpy(matrice_dinamica[0] , "Gennaio");
strcpy(matrice_dinamica[1] , "Febbraio");
strcpy(matrice_dinamica[2] , "Marzo");
strcpy(matrice_dinamica[3] , "Aprile");
strcpy(matrice_dinamica[4] , "Maggio");
strcpy(matrice_dinamica[5] , "Giugno");
strcpy(matrice_dinamica[6] , "Luglio");
strcpy(matrice_dinamica[7] , "Agosto");
strcpy(matrice_dinamica[8] , "Settembre");
strcpy(matrice_dinamica[9] , "Ottobre");
strcpy(matrice_dinamica[10], "Novembre");
strcpy(matrice_dinamica[11], "Dicembre");
int mese;
printf("Inserisci un numero da 1 a 12\n");
scanf("%d", &mese);
printf("%d -> %s\n", mese, array_di_puntatori[mese-1]);
printf("%d -> %s\n", mese, matrice[mese-1]);
printf("%d -> %s\n", mese, matrice_dinamica[mese-1]);
/* con l'allocazione dinamica e' compito del programmatore deallocare la memoria quando non serve piu'*/
/* prima dealloco i 12 array di caratteri di lunghezza 10 contenenti i mesi */
for(int k=0; k<12; k++)
free(matrice_dinamica[k]);
/* infine dealloco i 12 puntatori a caratteri che puntavano ai 12 vettori di caratteri prima deallocati */
free(matrice_dinamica);
return 0;
}
vagrant@ubuntu2204:/lab/6_pointers$ bin/11_pointers
Inserisci un numero da 1 a 12
6
6 -> Giugno
6 -> Giugno
6 -> Giugno
Quando un programma viene caricato in memoria per la sua esecuzione, al programma vengono assegnate delle porzioni di memoria dette sezioni o segmenti, ciscuna delle quali è deputata ad una funzione specifica. La memoria di un programma C consiste nelle seguenti sezioni:
- text segment (anche detto code segment)
- data segment (che si divide in tre zone: data, BSS e heap)
- stack segment
Il text segment (o anche code segment) è la parte della memoria che contiene le istruzioni eseguibili del programma. Per questioni di sicurezza (accidentali o malefiche modifiche del codice del programma), questa zona di memoria è in sola lettura (read-only) Il data segment è la parte di memoria che contiene: variabili globali, variabili statiche. Esso si divide in tre zone: data, BSS e heap
- Il segmento data contiene
- le variabili inizializzate dal programmatore nella dichiarazione (es:
static int i = 10
)
- le variabili inizializzate dal programmatore nella dichiarazione (es:
- Il segmento BSS (*Block Started by Symbol) contiene
- le variabili non inizializzate dal programmatore (es:
int vet[100]
), queste variabili vengono inizializzate dal sistema oprativo al valore 0 prima dell'esecuzione del programma
- le variabili non inizializzate dal programmatore (es:
- Il segmento heap è destinato ad ospitare la memoria allocata dinamicamente tramite funzioni come
malloc()
. Quando il programmatore allora o dealloca memoria dinamicamente la dimensione di questo segmento cresce o diminuisce. Questo segmento inizia dopo il BSS e cresce verso l'alto occupando indirizzi crescenti - Il segmento stack gestisce la chiamata a funzione ed ospita le variabili automatiche della funzione chiamata (variabil locali, classe memorizzazione
auto
) i parametri passati in ingresso alla funzione, l'indirizzo di ritorno al chiamante da cui riprendere l'esecuzine al termine dell'esecuzione della funzione ed il contenuto di alcuni registri della CPU. Lo stack cresce verso il basso dagli indirizzi più alti verso indirizzi più bassi e confina con il segmento heap
Lo stack è un'area di memoria contigua all'heap e cresce in direzione opposta a quest'utlimo, quando il puntatore allo stack incontra il puntatore all'heap, lo spazio di memoria libera per il programma è esautito.
In assenza di inizializzazioni esplicite, l'inizializzazione di una variabile segue alcune regole che dipendono dalla classe di memorizzazione alla quale la variabile appartiene. In particolare:
- le variabili globali vengono inizializzate a zero (si trovano nel BSS, se fossero state inizializzate esplictiamente sarebbero state nella sezione data del data segment)
- le variabili statiche vengono inizializzate a zero (si trovano nel BSS, se fossero state inizializzate esplictiamente sarebbero state nella sezione data del data segment)
- le variabili statiche e globali possono essere inizializzate solo tramite espresioni costanti (quindi non con valori di altre variabili non statiche o globali o valori restituiti da funzioni)
- le variabili locali possono essere inizializzate anche con valori di altre variabili o restituiti da funzione e se non inizializzate esplicitamente non vengono poste a zero ma contengono un valore casuale e non prevedibile a priori.
#include<stdio.h> // printf()
#include<stdlib.h> // malloc(), free()
#include<string.h> // strcpy()
#define N_ROWS 9
#define N_COLS 8
char **alloc_planets_mat_dyn(int n_rows, int n_cols);
void initialize_planets_mat_dyn(char **matrix);
void print_all_chars(char **array_of_pointers, char static_matrix[][N_COLS], char **dynamic_matrix);
void print_just_strings(char **array_of_pointers, char static_matrix[][N_COLS], char **dynamic_matrix);
void dealloc_planets_mat_dyn(char **matrix, int n_rows);
int main(void){
char *planets[] = {"Mercury", "Venus", "Earth", "Mars", "Jupiter", "Saturn", "Uranus", "Neptune", "Pluto"};
char planets_mat[N_ROWS][N_COLS] = {"Mercury", "Venus", "Earth", "Mars", "Jupiter", "Saturn", "Uranus", "Neptune", "Pluto"};
char **planets_mat_dyn = alloc_planets_mat_dyn(N_ROWS, N_COLS);
initialize_planets_mat_dyn(planets_mat_dyn);
print_all_chars(planets, planets_mat, planets_mat_dyn);
printf("\n\n");
print_just_strings(planets, planets_mat, planets_mat_dyn);
dealloc_planets_mat_dyn(planets_mat_dyn, N_ROWS);
return 0;
}
char **alloc_planets_mat_dyn(int n_rows, int n_cols){
char **matrix = (char **)malloc(n_rows*sizeof(char *)); /* alloco un vettore di puntatori a char (le righe) */
for(int i=0; i<n_rows; i++)
matrix[i] = (char *)malloc(n_cols*sizeof(char)); /* alloco un vettore di caratteri (le collonne di una riga) */
return matrix;
}
void dealloc_planets_mat_dyn(char **matrix, int n_rows){
/* prima dealloco le righe */
for(int i=0; i<n_rows; i++)
free(matrix[i]);
/* poi il vettore di puntatori a char */
free(matrix);
}
void initialize_planets_mat_dyn(char **matrix){
/*
matrix[0] = "Mercury";
matrix[1] = "Venus";
matrix[2] = "Earth";
matrix[3] = "Mars";
matrix[4] = "Jupiter";
matrix[5] = "Saturn";
matrix[6] = "Uranus";
matrix[7] = "Neptune";
matrix[8] = "Pluto";
*/
strcpy(matrix[0], "Mercury");
strcpy(matrix[1], "Venus");
strcpy(matrix[2], "Earth");
strcpy(matrix[3], "Mars");
strcpy(matrix[4], "Jupiter");
strcpy(matrix[5], "Saturn");
strcpy(matrix[6], "Uranus");
strcpy(matrix[7], "Neptune");
strcpy(matrix[8],"Pluto");
}
void print_all_chars(char **array_of_pointers, char static_matrix[][N_COLS], char **dynamic_matrix){
for(int i=0; i<N_ROWS; i++){
for(int j=0; j<N_COLS; j++){
printf("%c ", array_of_pointers[i][j]);
if(array_of_pointers[i][j] == '\0') break;
}
printf("\n");
}
printf("\n");
for(int i=0; i<N_ROWS; i++){
for(int j=0; j<N_COLS; j++){
printf("%c ", static_matrix[i][j]);
if(static_matrix[i][j] == '\0') break;
}
printf("\n");
}
printf("\n");
for(int i=0; i<N_ROWS; i++){
for(int j=0; j<N_COLS; j++){
printf("%c ", dynamic_matrix[i][j]);
if(dynamic_matrix[i][j] == '\0') break;
}
printf("\n");
}
printf("\n");
}
void print_just_strings(char **array_of_pointers, char static_matrix[][N_COLS], char **dynamic_matrix){
for(int i=0; i<N_ROWS; i++)
printf("%s\n", array_of_pointers[i]);
printf("\n");
for(int i=0; i<N_ROWS; i++)
printf("%s\n", static_matrix[i]);
printf("\n");
for(int i=0; i<N_ROWS; i++)
printf("%s\n", dynamic_matrix[i]);
printf("\n");
}
vagrant@ubuntu2204:/lab/6_pointers$ bin/12_pointers
M e r c u r y
V e n u s
E a r t h
M a r s
J u p i t e r
S a t u r n
U r a n u s
N e p t u n e
P l u t o
M e r c u r y
V e n u s
E a r t h
M a r s
J u p i t e r
S a t u r n
U r a n u s
N e p t u n e
P l u t o
M e r c u r y
V e n u s
E a r t h
M a r s
J u p i t e r
S a t u r n
U r a n u s
N e p t u n e
P l u t o
Mercury
Venus
Earth
Mars
Jupiter
Saturn
Uranus
Neptune
Pluto
Mercury
Venus
Earth
Mars
Jupiter
Saturn
Uranus
Neptune
Pluto
Mercury
Venus
Earth
Mars
Jupiter
Saturn
Uranus
Neptune
Pluto
Una struttura o struct è un tipo di dato derivato che permette di raggruppare un insieme di elementi di tipo diverso con una qualche forte correlazione tra loro, detti campi della struttura, in un'area contigua in memoria.
I campi della struttura possono essere semplici (predefiniti dal linguaggio) o derivari (anche altre sterutture stesse) e come detto possono essere di tipo diverso tra loro (al contrario degli array).
La sintassi per dichiarare una struttura è la seguente:
struct nome-struttura {
tipo-campo1 nome-campo1;
[tipo-campo2 nome-campo2;]
[...]
} ;
Per esempio per dichiarare un tipo che rappresenti un punto nello spazio bidimensionale:
/* dichiaro il nuovo tipo che si chiama: struct punto_2d */
struct punto_2d {
int x;
int y;
};
Una volta che il nuovo tipo è stata dichiarato è possibile dichiarare variabili o puntatori del nuovo tipo, in questo modo:
/* dichiaro una variabile ed un puntatore del tipo struct punto_2d
* fai attenzione che il nuovo tipo è "struct punto_2s" e non sola
* mente "punto_2d", non ti scordare "struct" nel nome del tipo.
*/
struct punto_2d i;
struct punto_2d *ptr
Per accedere ai singoli campi di una struttura attraverso una variabile basta usare il .
in questo modo: nome_variabile.nome_campo
, se si accede ai campi attraverso un puntatore si usa ->
in questo modo nome_variabile_puntatore->nome_campo
. Per esempio:
#include<stdio.h>
/* dichiaro il nuovo tipo che si chiama: struct punto_2d */
struct punto_2d {
int x;
int y;
};
int main(void){
/* dichiaro una variabile ed un puntatore del tipo struct punto_2d
* fai attenzione che il nuovo tipo è "struct punto_2s" e non sola
* mente "punto_2d", non ti scordare "struct" nel nome del tipo.
*/
struct punto_2d i;
struct punto_2d *ptr = NULL; /* alloco spazio per il puntatore */
/* il puntaore deve essere inizializzato all'indirizzo della struttura
* altrimenti non punta ad una locazione di memoria valida per noi
*/
ptr = &i;
/* inizializzo la struttura accedendo ai campi con la notazione puntata
* attraverso una variabile di tipo "struct punto_2d"
*/
i.x = 0;
i.y = 0;
printf("(%d, %d)\n", i.x, i.y);
/* accedo ai campi della struttura attraverso il puntatore usando -> */
ptr->x = 1;
ptr->y = 1;
printf("(%d, %d)\n", ptr->x, ptr->y);
return 0;
}
Una variabile di un tipo struct può essere passata normalmenete ad una funzione; come abbiamo studiato il passaggio dei parametri in C avviene sempre per valore e questo può essere un problema in termini di prestazioni e spreco di risorse se la struct ha numerosi campi. Per questo motivo le stuct sono quasi sempre passata per riferimento, cioè passando in ingresso alla funzione un puntatore a struttura. Vediamo quindi esclusivamente il caso di passaggio per riferimento.
#include<stdio.h>
#include<string.h>
struct studente {
char *nome;
char *cognome;
char *matricola;
int *voti;
int eta;
float media;
};
void calcola_media(struct studente *i);
int main(void){
struct studente ottimo;
struct studente medio;
struct studente scarso;
ottimo.nome = "Mario";
ottimo.cognome = "Rossi";
ottimo.matricola ="1234qwert";
ottimo.eta = 21;
ottimo.media = 0;
int tmp1[10] = {28, 30, 30, 30, 29,27,28, 30, 30, 30};
ottimo.voti = tmp1;
medio.nome = "Andrea";
medio.cognome = "Verdi";
medio.matricola ="9876zxcvb";
medio.eta = 24;
medio.media = 0;
int tmp2[10] = {26, 27, 24, 25, 26, 27, 23, 25, 24, 25};
medio.voti = tmp2;
scarso.nome = "Luigi";
scarso.cognome = "Bianchi";
scarso.matricola ="5678lkjhg";
scarso.eta = 31;
scarso.media = 0;
int tmp3[10] = {18, 20, 23, 18, 19, 22, 18, 20, 20, 19};
scarso.voti = tmp3;
calcola_media(&ottimo);
calcola_media(&medio);
calcola_media(&scarso);
printf("%s %s di eta' %d ha una media di %f\n", ottimo.nome, ottimo.cognome, ottimo.eta, ottimo.media);
printf("%s %s di eta' %d ha una media di %f\n", medio.nome, medio.cognome, medio.eta, medio.media);
printf("%s %s di eta' %d ha una media di %f\n", scarso.nome, scarso.cognome, scarso.eta, scarso.media);
return 0;
}
void calcola_media(struct studente *i){
float media = 0.0;
for(int j=0; j<10; j++)
i->media += i->voti[j];
i->media = i->media / 10;
}
vagrant@ubuntu2204:/lab/11_structs$ bin/1_structs
Mario Rossi di eta' 21 ha una media di 29.200001
Andrea Verdi di eta' 24 ha una media di 25.200001
Luigi Bianchi di eta' 31 ha una media di 19.700001
Un processo è un instanza di un programma; un programma (un file eseguibile presente sul disco) che è stato caricato in memoria.
Quando dalla riga di comando invochiamo il nome di un programma o clicchiamo sull'icona presente sulla scrivania il file eseguibile viene caricato in memoria ed ha inizio la sua esecuzione in un nuovo processo. Un singolo programma può far uso di più processi contemporaneamente per fare più cose contemporaneamente. La maggior parte dell funzioni per la manipolazione dei processi richiedono l'inclusione del file header <unistd.h>
Ciascun processo in Linux è identificato da un id univoco detto process ID anche detto PID. Un PID è lungo 16 bit (pid_t
definito in <sys/types.h
>. Per ottenere il proprio PID si richiamo la system call getpid()
, allo stesso modo per ottenere il PPID si richiama la getppid()
. Vediamo un esempio:
/***********************************************************************
* Code listing from "Advanced Linux Programming," by CodeSourcery LLC *
* Copyright (C) 2001 by New Riders Publishing *
* See COPYRIGHT for license information. *
***********************************************************************/
#include <stdio.h>
#include <unistd.h>
int main ()
{
printf ("The process id is %d\n", (int) getpid ());
printf ("The parent process id is %d\n", (int) getppid ());
return 0;
}
Il comando ps mostra i processi attivi sul sistema.
vagrant@ubuntu2204:/lab2/0_processes$ ps
PID TTY TIME CMD
1331 pts/0 00:00:00 bash
1421 pts/0 00:00:00 ps
Sembra ci siano due processi attivi sul sistema, il primo è bash ed il secondo è ps che abbiamo lanciato. La prima colonna mostra il PID dei processi attivi. Per maggiori dettagli possiamo digitare
ps -e -o pid,ppid, command
Opzione | Significato |
---|---|
-e |
mostra tutti i processi attivi sul sistema non solo quelli dell'utente corrente |
-o |
specifica quali informazioni mostrare per il singolo processo |
pid |
mostra il pid |
ppid |
mostra il ppid |
ppid |
mostra il programma eseguito all'interno del processo |
vagrant@ubuntu2204:/lab2/0_processes$ ps -e -o pid,ppid,command
PID PPID COMMAND
1 0 /sbin/init =
2 0 [kthreadd]
3 2 [rcu_gp]
4 2 [rcu_par_gp]
5 2 [slub_flushwq]
6 2 [netns]
8 2 [kworker/0:0H-events_highpri]
10 2 [mm_percpu_wq]
11 2 [rcu_tasks_rude_]
12 2 [rcu_tasks_trace]
13 2 [ksoftirqd/0]
14 2 [rcu_sched]
15 2 [migration/0]
16 2 [idle_inject/0]
18 2 [cpuhp/0]
19 2 [cpuhp/1]
20 2 [idle_inject/1]
21 2 [migration/1]
22 2 [ksoftirqd/1]
24 2 [kworker/1:0H-events_highpri]
25 2 [kdevtmpfs]
26 2 [inet_frag_wq]
27 2 [kauditd]
28 2 [khungtaskd]
29 2 [oom_reaper]
30 2 [writeback]
31 2 [kcompactd0]
32 2 [ksmd]
33 2 [khugepaged]
80 2 [kintegrityd]
81 2 [kblockd]
82 2 [blkcg_punt_bio]
83 2 [tpm_dev_wq]
84 2 [ata_sff]
85 2 [md]
86 2 [edac-poller]
87 2 [devfreq_wq]
88 2 [watchdogd]
90 2 [kworker/0:1H-kblockd]
92 2 [kswapd0]
93 2 [ecryptfs-kthrea]
95 2 [kthrotld]
96 2 [acpi_thermal_pm]
98 2 [scsi_eh_0]
99 2 [scsi_tmf_0]
100 2 [scsi_eh_1]
101 2 [scsi_tmf_1]
103 2 [vfio-irqfd-clea]
104 2 [kworker/u4:4-events_unbound]
105 2 [mld]
106 2 [ipv6_addrconf]
115 2 [kstrp]
118 2 [zswap-shrink]
119 2 [kworker/u5:0]
124 2 [charger_manager]
148 2 [kworker/1:1H-kblockd]
165 2 [kworker/0:2-events]
166 2 [cryptd]
175 2 [scsi_eh_2]
178 2 [scsi_tmf_2]
217 2 [kdmflush]
243 2 [raid5wq]
291 2 [jbd2/dm-0-8]
292 2 [ext4-rsv-conver]
354 1 /lib/systemd/systemd-journald
379 2 [kaluad]
382 2 [kmpath_rdacd]
385 2 [kmpathd]
386 2 [kmpath_handlerd]
387 1 /sbin/multipathd -d -s
391 1 /lib/systemd/systemd-udevd
440 2 [kworker/u4:6-events_power_efficient]
504 2 [jbd2/sda2-8]
505 2 [ext4-rsv-conver]
524 2 [kworker/0:4-events]
526 1 /lib/systemd/systemd-networkd
534 1 /usr/sbin/haveged --Foreground --verbose=1
538 1 /lib/systemd/systemd-resolved
602 1 /usr/sbin/cron -f -P
603 1 @dbus-daemon --system --address=systemd: --nofork --nopidfile --systemd-acti
610 1 /usr/sbin/irqbalance --foreground
611 1 /usr/bin/python3 /usr/bin/networkd-dispatcher --run-startup-triggers
612 1 /usr/libexec/polkitd --no-debug
614 1 /usr/sbin/rsyslogd -n -iNONE
620 1 /usr/lib/snapd/snapd
624 1 /lib/systemd/systemd-logind
629 1 /usr/libexec/udisks2/udisksd
644 1 /usr/sbin/ModemManager
658 1 /usr/sbin/ifplugd -i eth0 -q -f -u0 -d10 -w -I
666 1 /sbin/agetty -o -p -- \u --noclear tty1 linux
696 1 sshd: /usr/sbin/sshd -D [listener] 0 of 10-100 startups
704 1 /usr/sbin/VBoxService
1279 696 sshd: vagrant [priv]
1282 1 /lib/systemd/systemd --user
1283 1282 (sd-pam)
1330 1279 sshd: vagrant@pts/0
1331 1330 -bash
1427 2 [kworker/1:0-events]
1429 2 [kworker/1:3-events]
1453 2 [kworker/u4:0-events_unbound]
1455 1331 ps -e -o pid,ppid,command
Tu puoi uccidere un processo con il comando kill
. Semplicemente indica sulla riga di comand il pid del processo che deve essere ucciso. Il comando kill invia al processo un signale SIGTERM
. La ricezione di questo segnale determina (a meno che il processo non gestisca il signale o lo ignori) la terminazione del processo.
Ci sono due modi per crare un processo; il primo è relativamente semplice ma è inefficiente e rischioso da un punto di vista di sicurezza, il secondo è più complesso ma fornisce maggiore sicurezza e flessibilità.
La funzione system()
è fornita nella libreria standard del linguaggio C e fornisce un modo semplice per eseguire un comando all'interno di un programma come se il comando fosse stato digitato all'interno di una shell. La funzione system()
crea un sottoprocesso lanciando /bin/sh
. Per esempio il codice di sotto invoce il comando ls
per mostrare il contenuto della root directory come se si fosse digitato ls -l /
direttamente dalla shell
/***********************************************************************
* Code listing from "Advanced Linux Programming," by CodeSourcery LLC *
* Copyright (C) 2001 by New Riders Publishing *
* See COPYRIGHT for license information. *
***********************************************************************/
#include <stdlib.h>
int main ()
{
int return_value;
return_value = system ("ls -l /");
return return_value;
}
La system call fork()
crea un nuovo processo che è la copia identica del processo padre. La exec()
permette di sostituire il processo padre con un nuovo programma nel processo appena creato con la fork()
.
Per distinguire il padre del figlio la funzione fork()
restituisce un intero: in particolare restituisce zero al processo figlio ed il pid del processo figlio al padre.
/***********************************************************************
* Code listing from "Advanced Linux Programming," by CodeSourcery LLC *
* Copyright (C) 2001 by New Riders Publishing *
* See COPYRIGHT for license information. *
***********************************************************************/
#include <stdio.h>
#include <sys/types.h>
#include <unistd.h>
int main ()
{
pid_t child_pid;
printf ("the main program process id is %d\n", (int) getpid ());
child_pid = fork ();
if (child_pid != 0) {
printf ("this is the parent process, with id %d\n", (int) getpid ());
printf ("the child's process id is %d\n", (int) child_pid);
}
else
printf ("this is the child process, with id %d\n", (int) getpid ());
return 0;
}
Nota che il codice all'interno del blocco if
è eseguito solo dal processo padre, mentre il codice dentro il blocco else
è eseguito dal processo figlio.
La systam call exec()
sostituisce il programma eseguito all'interno del processo con un nuovo programma. Quando un programma richiama la exec()
il processo smette immediatamente di eseguire il programma e ed inizio l'esecuzione del nuovo programma richiamata dalla exec()
.
Ci sono diverse versioni della exec()
:
- Funzioni che contengono la lettera
p
nel nome (exexcvp
,execlp
) accettano il nome del programma e lo cercano nel sistema; le funzioni che non contengono lap
nel nome necessitano del percorso assoluto del programma da eseguire - Funzioni che contengono la lettera
v
nel nome (execv
,execvp
,execve
) accettano una lista di argomenti da passare in ingresso al nuovo programma come un array di puntatori a caratteri terminati daNULL
. Le funzioni invece che contengono la lettral
(execl
execlp
,execle
) accettano una lista di argomenti in ingresso secondo il meccanismo dellevargargs
del lingugiaggio C - Funzioni che contengono la lettera
e
nel nome (execve
,execle
) accettano un argomento in più, un array di variabili d'ambiente. L'argomento dovrebbe essere un array di puntatori a caratteri terminato daNULL
, ciascun stringa dovrebbe essere nella formaVARIABILE=valore
/***********************************************************************
* Code listing from "Advanced Linux Programming," by CodeSourcery LLC *
* Copyright (C) 2001 by New Riders Publishing *
* See COPYRIGHT for license information. *
***********************************************************************/
#include <stdio.h>
#include <stdlib.h>
#include <sys/types.h>
#include <unistd.h>
/* Spawn a child process running a new program. PROGRAM is the name
of the program to run; the path will be searched for this program.
ARG_LIST is a NULL-terminated list of character strings to be
passed as the program's argument list. Returns the process id of
the spawned process. */
int spawn (char* program, char** arg_list)
{
pid_t child_pid;
/* Duplicate this process. */
child_pid = fork ();
if (child_pid != 0)
/* This is the parent process. */
return child_pid;
else {
/* Now execute PROGRAM, searching for it in the path. */
execvp (program, arg_list);
/* The execvp function returns only if an error occurs. */
fprintf (stderr, "an error occurred in execvp\n");
abort ();
}
}
int main ()
{
/* The argument list to pass to the "ls" command. */
char* arg_list[] = {
"ls", /* argv[0], the name of the program. */
"-l",
"/",
NULL /* The argument list must end with a NULL. */
};
/* Spawn a child process running the "ls" command. Ignore the
returned child process id. */
spawn ("ls", arg_list);
printf ("done with main program\n");
return 0;
}
Eseguendo il programma ti accorgerai che il processo padre termina immediatamente ("done with the main program") successivamente viene stampato il prompt e poco dopo l'output del processo figlio sporca il terminale perchè continua a scrivere sullo stdout. In generale non è possibile sapere quale processo tra il padre ed il figlio concluda per primo ma vedremo che è possibile sincronizzare l'esecuzione dei due processi facendo in modo che il processo padre attenda la terminazione dei suoi figli prima di concludere la propria esecuzione.
vagrant@ubuntu2204:/lab2/0_processes$ bin/3_fork_exec
done with main program
vagrant@ubuntu2204:/lab2/0_processes$ total 2097224
lrwxrwxrwx 1 root root 7 Aug 10 2023 bin -> usr/bin
drwxr-xr-x 4 root root 4096 Jan 11 2024 boot
drwxr-xr-x 19 root root 3980 Aug 12 08:33 dev
drwxr-xr-x 104 root root 4096 Aug 12 08:33 etc
drwxr-xr-x 3 root root 4096 Jan 10 2024 home
drwxrwxrwx 1 vagrant vagrant 4096 Aug 9 07:23 lab
drwxrwxrwx 1 vagrant vagrant 0 Aug 12 08:30 lab2
lrwxrwxrwx 1 root root 7 Aug 10 2023 lib -> usr/lib
lrwxrwxrwx 1 root root 9 Aug 10 2023 lib32 -> usr/lib32
lrwxrwxrwx 1 root root 9 Aug 10 2023 lib64 -> usr/lib64
lrwxrwxrwx 1 root root 10 Aug 10 2023 libx32 -> usr/libx32
drwx------ 2 root root 16384 Jan 10 2024 lost+found
drwxr-xr-x 2 root root 4096 Aug 10 2023 media
drwxr-xr-x 2 root root 4096 Aug 10 2023 mnt
drwxr-xr-x 2 root root 4096 Aug 10 2023 opt
dr-xr-xr-x 162 root root 0 Aug 12 08:32 proc
drwx------ 5 root root 4096 Jan 11 2024 root
drwxr-xr-x 28 root root 840 Aug 12 10:37 run
lrwxrwxrwx 1 root root 8 Aug 10 2023 sbin -> usr/sbin
drwxr-xr-x 6 root root 4096 Jul 7 07:31 snap
drwxr-xr-x 2 root root 4096 Aug 10 2023 srv
-rw------- 1 root root 2147483648 Jan 10 2024 swap.img
dr-xr-xr-x 13 root root 0 Aug 12 08:32 sys
drwxrwxrwt 12 root root 4096 Aug 12 16:36 tmp
drwxr-xr-x 14 root root 4096 Aug 10 2023 usr
drwxr-xr-x 13 root root 4096 Aug 10 2023 var
I segnali sono un meccanismo per comunicare e manipolare i processi in Linux. Un segnale è semplicemente un messaggio inviato ad un processo. I segnali sono definiti il linux in /usr/include/bits/signum.h
ma per usarli basta includere <signal.h>
nel tuo sorgente.
Quando un processo riceve un segnale può comportarsi in modi differenti sulla base della disposizione di default che determina che cosa accade se il programma non specifica qualche altre comportamente specifico per il segnale. Per ciascun segnale, un programma può:
- Specificare un diverso comportamente dalla disposizione di default
- Ignora il segnale
- Chiamare una funzione, detta signal-handler per rispondere in modo personalizzato al segnale
Se una funzione signal-handler è usata, l'esecuzione del programma è messa in pausa e la funzione è immeditamente eseguita e solo dopo che questa termina l'esecuzione del programma riprende nel punto dove si era interrotta.
Alcuni esempi di segnali sono
First Header | Significato | Disposizione |
---|---|---|
SIGSEGV |
segmentation fault | termina il processo |
SIGTERM |
chiede al processo di terminare, il processo potrebbe ignorare il segnale di terminazione | termina il processo |
SIGKILL |
termina il processo immediatamente, il processo non può ignorare questo segnale | termina il processo |
SIGUSR1 |
Definito dall'utente | |
SIGUSR2 |
Definito dall'utente | |
SIGHUP |
Risveglia un processo o lo mette in sleep o lo costringe e rileggere la sua configurazione |
La sigaction può essere usata per settare la disposizione per un segnale (per modificare la disposizione di default). Questa riceva in ingresso tre parametri:
int
: il numero del segnaleconst struct sigaction *
: la disposizione desiderata per il segnalestruct sigaction *
: la precedente disposizione per il segnale
int sigaction(int signum,
const struct sigaction *_Nullable restrict act,
struct sigaction *_Nullable restrict oldact);
La struct sigaction
ha questa forma:
struct sigaction {
void (*sa_handler)(int);
void (*sa_sigaction)(int, siginfo_t *, void *);
sigset_t sa_mask;
int sa_flags;
void (*sa_restorer)(void);
};
Il campo più importante in questa struttura è sa_handler
che può assumere uno di questi tre valori:
- SIG_DFL
- SIG_IGN
- Un puntatore alla funzione signal-handler. La funzione dovrebbe accettare un paraemtre (il numero del segnale) e ritornare
void
.
Quando il segnale viene processata dal programma questo può essere in uno stato altamente instabile (quindi durante l'esecuzione di un signal-hadler). Quindi all'interno di una funzione signal-hanlder bisogna svolgere solo i task strettamente necessari per gestire/rispondere il/al segnale ed evitare operazione di I/O o richiamare librerie esterne o del linguaggio. Può accadere che un signal-handler sia interrotto a causa della ricezione di un altro segnale e questo è un problema molto complicato da diagnosticare e debuggare e per questo bisogna essere molto cauti su cosa fare dentro un signal-handler.
Un altro aspetto da tenere in considerazione è rendere le prorpie istruzioni (variabili globali) atomiche usando il tipo sig_atomic_t
. Linux garantisce che l'assegnazione di variabili di questo tipo avvenga in modo atomico e non possa essere interrotto dall'arrivo di un nuovo segnale.
Vediamo un esempio di signal-handler per la gestione del segnale SIGUSR1 uno dei due segnale riservati all'uso da parte dei programmi applicativi.
/***********************************************************************
* Code listing from "Advanced Linux Programming," by CodeSourcery LLC *
* Copyright (C) 2001 by New Riders Publishing *
* See COPYRIGHT for license information. *
***********************************************************************/
#include <signal.h>
#include <stdio.h>
#include <string.h>
#include <sys/types.h>
#include <unistd.h>
#include <time.h>
#define SOME_MINUTES 5
#define SECONDS_PER_MINUTE 60
sig_atomic_t sigusr1_count = 0;
void handler (int signal_number)
{
++sigusr1_count;
}
int main ()
{
struct sigaction sa;
memset (&sa, 0, sizeof (sa));
sa.sa_handler = &handler;
sigaction (SIGUSR1, &sa, NULL);
time_t start = time(NULL);
while (time(NULL) - start < (time_t) (SOME_MINUTES * SECONDS_PER_MINUTE)) {
printf("*");
}
printf ("SIGUSR1 was raised %d times\n", sigusr1_count);
return 0;
}
In un primo terminale esegui il programma che resterà in esecuzione per 5 minuti, alla fine dell'esecuzione stamperà il numero di volte che il segnale SIGUSR1
è stato ricevuto.
vagrant@ubuntu2204:/lab2/0_processes$ bin/4_sigusr1
***************************************************
**************************SIGUSR1 was raised 6 times
Per inviare il segnale SIGUSR1
basta usare il comando kill
usando il PID del processo (che puoi recuperare con il comando ps
come mostrato sotto)
vagrant@ubuntu2204:~$ ps -e|grep 4_sigusr1
1642 pts/0 00:01:17 4_sigusr1
vagrant@ubuntu2204:~$ kill -SIGUSR1 1642
vagrant@ubuntu2204:~$ kill -SIGUSR1 1642
vagrant@ubuntu2204:~$ kill -SIGUSR1 1642
vagrant@ubuntu2204:~$ kill -SIGUSR1 1642
vagrant@ubuntu2204:~$ kill -SIGUSR1 1642
vagrant@ubuntu2204:~$ kill -SIGUSR1 1642
Un processo termina o attraverso la chiamata alla funzione exit()
o quando termina la funzione main()
del programma (attraverso return
o perchè raggiunge l'ultima istruzione del blocco della funzione main()
). Il valore intero ritornato attraverso return
o come parametro in input alla exit()
è detto exit code. Un processo può anche terminare in risposta ad un segnale (SIGSEGV
, SIGKILL
etc). Altri segnali per terminare un processo sono SIGINT
inviato quando si preme la combinazione di tast CTRL+C
nel terminale occupato del programma. Un altro segnale che termina un processo è SIGABRT
che oltre che terminare il processo genera un core file, è possibile inviare questo segnale attraverso la chiamata abort()
. Il modo più brutale per terminare un processo è quello di inviare il segnale SIGKILL
che termina immediatamente il processo e non può essere ignorato o bloccato.
Tutti questi segnale ed anche altri possono essere inviati con il comando kill
specificando quale segnale inviare come parametro, per inviare un SIGKILL
fai in questo modo:
kill -KILL pid
Esiste anche la funzione kill()
per inviare un segnale dal codice ed ha questo prototipo:
int kill(pid_t pid, int sig);
pid_t pid
: il pid del processoint sig
: segnale da inviare
Devi includere <sys/types.h>
e <signal.h
per utilizzare la funzione kill()
.
Important
Per convenzione, exit code è usato per indicare se il programma ha terminato la sua esecuzione correttamente o con degli errir. Un valore pari a zero indica una corretta esecuzione mentre valori diversi da zero indicano che il processo ha terminato con qualche errore. E' importante seguire questa convezione se vuoi usare gli operatori logici della shell (&&
||
) per concatenare più programma tra loro.
Puoi leggere l'exit code dell'ultimo programma lanciato sulla shell stampando il contenuto della variabile $?
per esempio
vagrant@ubuntu2204:/lab2/0_processes$ ls
0_print_pid.c 1_system.c 2_fork.c 3_fork_exec.c 4_sigusr1.c bin
vagrant@ubuntu2204:/lab2/0_processes$ echo $?
0
Quando si esegue la coppia di chiamate fork()
ed exec()
per creare un processo figlio siamo in grado, all'interno dello stesso codice, di differenziare quali istruzioni saranno eseguite dal padre e quali dal processo figlio sfruttando l'intero di ritorno della chiamata fork()
. Nulla però ci assicura che il padre terminerà prima del figlio, l'ordine di terminazione dipende dal numero di istruzioni dei due processi e soprattutto da come il sistema operativo andrà a schedulare i due processi nell'assegnazione dei tempi di CPU. Quando è necessario che per la correttezza del nostro programma il padre termini soltanto al termine dell'esecuzione del processo figlio è obbligo usare la funzione wait()
.
La wait()
l'esecuzione del processo padre finchè uno dei suoi figli ha terminato (anche con un errore, non importa). Inoltre la wait()
ritorna uno status code (exit code) dal quale estrarre informazioni su come il processo figlio ha terminato l'esecuzione. Per esempio la macro WEXITSTATUS
contiene l'exit code del processo figlio.
Vediamo un esempio:
/***********************************************************************
* Code listing from "Advanced Linux Programming," by CodeSourcery LLC *
* Copyright (C) 2001 by New Riders Publishing *
* See COPYRIGHT for license information. *
***********************************************************************/
#include <stdio.h>
#include <stdlib.h>
#include <sys/types.h>
#include <sys/wait.h>
#include <unistd.h>
/* Spawn a child process running a new program. PROGRAM is the name
of the program to run; the path will be searched for this program.
ARG_LIST is a NULL-terminated list of character strings to be
passed as the program's argument list. Returns the process id of
the spawned process. */
int spawn (char* program, char** arg_list)
{
pid_t child_pid;
/* Duplicate this process. */
child_pid = fork ();
if (child_pid != 0)
/* This is the parent process. */
return child_pid;
else {
/* Now execute PROGRAM, searching for it in the path. */
execvp (program, arg_list);
/* The execvp function returns only if an error occurs. */
fprintf (stderr, "an error occurred in execvp\n");
abort ();
}
}
int main ()
{
int child_status;
/* The argument list to pass to the "ls" command. */
char* arg_list[] = {
"ls", /* argv[0], the name of the program. */
"-l",
"/",
NULL /* The argument list must end with a NULL. */
};
/* Spawn a child process running the "ls" command. Ignore the
returned child process id. */
spawn ("ls", arg_list);
/* Wait for the child process to complete. */
wait(&child_status);
if (WIFEXITED(child_status))
printf("the child process exited normally, with exit code %d\n", WEXITSTATUS(child_status));
else
printf("the child process exited abnormally\n");
printf("done with main program\n");
return 0;
}
Come puoi vedere sotto, prima il terminale è occupato dell'output del processo figlio (ls -l
) e successivamente il processo padre termina stampando a schermo (done with the main program
).
vagrant@ubuntu2204:/lab2/0_processes$ bin/5_fork_exec_wait
total 2097224
lrwxrwxrwx 1 root root 7 Aug 10 2023 bin -> usr/bin
drwxr-xr-x 4 root root 4096 Jan 11 2024 boot
drwxr-xr-x 19 root root 3980 Aug 12 08:33 dev
drwxr-xr-x 104 root root 4096 Aug 12 08:33 etc
drwxr-xr-x 3 root root 4096 Jan 10 2024 home
drwxrwxrwx 1 vagrant vagrant 4096 Aug 9 07:23 lab
drwxrwxrwx 1 vagrant vagrant 0 Aug 12 08:30 lab2
lrwxrwxrwx 1 root root 7 Aug 10 2023 lib -> usr/lib
lrwxrwxrwx 1 root root 9 Aug 10 2023 lib32 -> usr/lib32
lrwxrwxrwx 1 root root 9 Aug 10 2023 lib64 -> usr/lib64
lrwxrwxrwx 1 root root 10 Aug 10 2023 libx32 -> usr/libx32
drwx------ 2 root root 16384 Jan 10 2024 lost+found
drwxr-xr-x 2 root root 4096 Aug 10 2023 media
drwxr-xr-x 2 root root 4096 Aug 10 2023 mnt
drwxr-xr-x 2 root root 4096 Aug 10 2023 opt
dr-xr-xr-x 163 root root 0 Aug 12 08:32 proc
drwx------ 5 root root 4096 Jan 11 2024 root
drwxr-xr-x 28 root root 840 Aug 12 10:37 run
lrwxrwxrwx 1 root root 8 Aug 10 2023 sbin -> usr/sbin
drwxr-xr-x 6 root root 4096 Jul 7 07:31 snap
drwxr-xr-x 2 root root 4096 Aug 10 2023 srv
-rw------- 1 root root 2147483648 Jan 10 2024 swap.img
dr-xr-xr-x 13 root root 0 Aug 12 08:32 sys
drwxrwxrwt 12 root root 4096 Aug 12 16:36 tmp
drwxr-xr-x 14 root root 4096 Aug 10 2023 usr
drwxr-xr-x 13 root root 4096 Aug 10 2023 var
the child process exited normally, with exit code 0
done with main program
Quando un processo figlio termina ed il processo padre ha chiamato la wait()
le informazioni circa la terminazione della propria esecuzione sono passati attraverso la wait()
al padre. Se il padre non chiama la waiit()
queste informazioni vanno perse? No, perchè in questo caso il processo figlio diventa un processo zombie.
Un processo zombie è un processo che ha terminato la propria esecuzione ma non è stato ancora pulito, è compito del processo padre ripulire il processo proprio processo figlio zombie. Il compito della wait()
è appunto questo: una volta che il processo figlio termina questo diventa una zombio poi la wait()
andrà ad estrarre lo status di uscita del figlio zombie e finalmente il processo figlio può essere eliminato. Se il processo padre non chiama la wait()
il figlio resta nello stato di zombie, vediamo un esempio:
/***********************************************************************
* Code listing from "Advanced Linux Programming," by CodeSourcery LLC *
* Copyright (C) 2001 by New Riders Publishing *
* See COPYRIGHT for license information. *
***********************************************************************/
#include <stdlib.h>
#include <sys/types.h>
#include <unistd.h>
int main ()
{
pid_t child_pid;
/* Create a child process. */
child_pid = fork ();
if (child_pid > 0) {
/* This is the parent process. Sleep for a minute. */
sleep (60);
}
else {
/* This is the child process. Exit immediately. */
exit (0);
}
return 0;
}
Lancia il programma da un terminale in questo modo:
vagrant@ubuntu2204:/lab2/0_processes$ bin/6_zombie
Ed usa, su un altro terminale, il comando ps
in questo modo:
vagrant@ubuntu2204:~$ ps -e -o pid,ppid,stat,cmd|grep 6_zombie
2317 1331 S+ bin/6_zombie
2318 2317 Z+ [6_zombie] <defunct>
2325 2301 S+ grep --color=auto 6_zombie
Il processo padre ha pid 2317
ed è in sleep S+
il processo figlio è <defunct>
ed è uno zombio Z+
Quando il processo padre termina prima del figlio senza chiamare la wait()
, chi si occupa di ripulire il processo figlio e portarlo dallo stato di zombie a terminato? Il processo init che è il padre di tutti i processi (init infatti ha PID=1) ed eredita tutti i figli rimasti orfani del proprio padre. Se rilanci ps
dopo un po' di tempo vedrai che il processo figlio con pid 2318
non esiste più in quanto è stato ripulito da init.
La wait()
ci permette di attendere (nel codice del padre) la terminazione del figlio. Il problema è che la chiamata alla wait()
è bloccante quindi il codice del padre rimane (appeso) bloccata all'istruzione di wait fino a quando il figlio non termina. Se si vuole che il padre continui la propria elaborazione mentre si attende che il figlio completi è possibile controllare periodicamente la terminazione del figlio chiamando wait3()
o wait4()
(flag WNOHANG
) in modo asincrono ogni tanto nel codice del padre. Una soluzione migliore è usare il segnale SIGCHLD
che Linux invia al padre ogni volta che uno dei suoi figli termina. Vediamo un esempio:
/***********************************************************************
* Code listing from "Advanced Linux Programming," by CodeSourcery LLC *
* Copyright (C) 2001 by New Riders Publishing *
* See COPYRIGHT for license information. *
***********************************************************************/
#include <signal.h> // sigaction
#include <string.h> // memset()
#include <stdio.h> // fprintf()
#include <stdlib.h> // abort()
#include <sys/types.h> // pid_t
#include <sys/wait.h> // wait()
#include <unistd.h> // fork() exec()
#include <time.h> // time()
#define N_CHILDS 10
#define SOME_MINUTES 2
#define SECONDS_PER_MINUTE 60
sig_atomic_t child_exit_status;
void clean_up_child_process (int signal_number)
{
/* Clean up the child process. */
int status;
wait (&status);
/* Store its exit status in a global variable. */
child_exit_status = status;
fprintf (stdout, "Child exit with %d status\n", status);
}
int spawn (char* program, char** arg_list)
{
pid_t child_pid;
/* Duplicate this process. */
child_pid = fork ();
if (child_pid != 0){
/* This is the parent process. */
fprintf (stdout, "Child %d created\n", child_pid);
} else {
/* Now execute PROGRAM, searching for it in the path. */
execvp (program, arg_list);
/* The execvp function returns only if an error occurs. */
fprintf (stderr, "an error occurred in execvp\n");
abort ();
}
}
int main ()
{
/* Handle SIGCHLD by calling clean_up_child_process. */
struct sigaction sigchld_action;
memset (&sigchld_action, 0, sizeof (sigchld_action));
sigchld_action.sa_handler = &clean_up_child_process;
sigaction (SIGCHLD, &sigchld_action, NULL);
/* Now do things, including forking a child process. */
/* The argument list to pass to the "ls" command. */
char* arg_list[] = {
"sleep", /* argv[0], the name of the program. */
"60",
NULL /* The argument list must end with a NULL. */
};
for(int i=0; i<N_CHILDS; i++)
spawn ("sleep", arg_list);
time_t start = time(NULL);
while (time(NULL) - start < (time_t) (SOME_MINUTES * SECONDS_PER_MINUTE));
fprintf (stdout, "Father's quitting\n");
return 0;
}
vagrant@ubuntu2204:/lab2/0_processes$ bin/7_sigchld
Child 3099 created
Child 3100 created
Child 3101 created
Child 3102 created
Child 3103 created
Child 3104 created
Child 3105 created
Child 3106 created
Child 3107 created
Child 3108 created
Child exit with 0 status
Child exit with 0 status
Child exit with 0 status
Child exit with 0 status
Child exit with 0 status
Child exit with 0 status
Child exit with 0 status
Child exit with 0 status
Father's quitting
I thread come i processi sono un meccanismo per permettere ad un programma di svolgere più compiti contemporaneamenente. Come i processi anche i thread si contengono la CPU per l'esecuzione. Da un punsto di vista teorico un threada esiste all'interno di un processo: quando un programma viene invocato, Linux crea un nuovo processo ed al suo interno crea anche un singolo thread che esegue il programma in modo sequenziale. Questo thread può creare altri thread che eseguono lo stesso programma nello stesso processo ma ciascun thread potrebbe eseguire una parte diversa del programma in un qualsiasi momento.
Abbiamo visto come un processo può forkare un processo figlio. Il processo figlio inizialmente esegue il programma del padre come una copia della memoria virtuale del processo padre, i descrittori dei file e così via. Il processo figlio può modificare la sua memoria, chiudere i descrittori dei file etc senza alterare quelli del padre. Quando un thread crea un nuovo thread nulla è copiato. Il thread padre ed il thread figlio condividono la stessa memoria, i descrittori dei file e tutte le altre risorse. Se un thread cambia il valore di una variabile anche l'altro thread vedrà questa modifica; se un thread chiude un descrittore di un file gli altri thread potrebbero non poter più leggere o scrivere su quel descrittore. Siccome un processo e tutti i suoi thread possono eseguire un solo programma alla volta se un thread richiama la exec()
tutti i thread saranno terminati.
Linux implementa le API POSIX per i thread (conosciuto come pthread). Tutte le funzioni per i thread sono definite nel file d'intestazione <pthread.h>
che non è inclusa nella librearia standard fornita dal linguaggio C. La librearia è fornita in libpthread.so
ed è necessario passare il parametro -lpthread
a gcc per linkarla al momento della compilazione.
Ad ogni thread è associato un id univoco di tipo pthread_t
.
Una volta creato un thread esegue un semplice funzione che contiene il codice che il thread dovrà eseguire, quando questa funzione termina anche il thread termina la propria esecuzione. Questa funzione riceva in ingresso un puntatore a void void *
e ritorna sempre un altro puntatore a void void *
.
Per creare un nuovo thread bisogna usare la funzione pthread_create()
, questo è il suo prototipo:
int pthread_create(pthread_t *restrict thread,
const pthread_attr_t *restrict attr,
void *(*start_routine)(void *),
void *restrict arg);
pthread *t
: un puntatore al thread idconst pthread_attr_t *
: un puntatore all'oggetto contenente gli attributi del thread: questo oggetto controlla i dettagli di ocme il thread interagisce con il resto del programma. Se passiNULL
come attributo del thread, il thread sarà creato con gli attributi di default.void* (*) (void*)
: un puntore alla funzione del thread, questo è un semplice puntatore a funzionevoid *
: l'argomento in ingresso da passare alla funzione del thread di tipovoid *
Vediamo un esempio di creazione di un thread:
/***********************************************************************
* Code listing from "Advanced Linux Programming," by CodeSourcery LLC *
* Copyright (C) 2001 by New Riders Publishing *
* See COPYRIGHT for license information. *
***********************************************************************/
#include <pthread.h>
#include <stdio.h>
/* Prints x's to stderr. The parameter is unused. Does not return. */
void* print_xs (void* unused)
{
while (1)
fputc ('x', stderr);
return NULL;
}
/* The main program. */
int main ()
{
pthread_t thread_id;
/* Create a new thread. The new thread will run the print_xs
function. */
pthread_create (&thread_id, NULL, &print_xs, NULL);
/* Print o's continuously to stderr. */
while (1)
fputc ('o', stderr);
return 0;
}
Il thread termina quando termina la funzione del thread print_xs
, un thread può ritornare anche richiamando la funzione pthread_exit()
Per passare argomenti ad un thread basta usare il quarto argomento della pthread_create()
. Per farlo basta solo dichiarare una struttura o un array e passare il puntatore alla pthread_create
.
L'unica accortezza da tenere in considerazione è quella di ricastare il parametro in ingresso alla funzone del thread al tipo corretto.
Vediamo un esempio:
/***********************************************************************
* Code listing from "Advanced Linux Programming," by CodeSourcery LLC *
* Copyright (C) 2001 by New Riders Publishing *
* See COPYRIGHT for license information. *
***********************************************************************/
#include <pthread.h>
#include <stdio.h>
/* Parameters to print_function. */
struct char_print_parms
{
/* The character to print. */
char character;
/* The number of times to print it. */
int count;
};
/* Prints a number of characters to stderr, as given by PARAMETERS,
which is a pointer to a struct char_print_parms. */
void* char_print (void* parameters)
{
/* Cast the cookie pointer to the right type. */
struct char_print_parms* p = (struct char_print_parms*) parameters;
int i;
for (i = 0; i < p->count; ++i)
fputc (p->character, stderr);
return NULL;
}
/* The main program. */
int main ()
{
pthread_t thread1_id;
pthread_t thread2_id;
struct char_print_parms thread1_args;
struct char_print_parms thread2_args;
/* Create a new thread to print 30000 x's. */
thread1_args.character = 'x';
thread1_args.count = 30000;
pthread_create (&thread1_id, NULL, &char_print, &thread1_args);
/* Create a new thread to print 20000 o's. */
thread2_args.character = 'o';
thread2_args.count = 20000;
pthread_create (&thread2_id, NULL, &char_print, &thread2_args);
return 0;
}
Il problema in questo codice è che le due variabili locali (automatiche) thread1_args
e thread1_args
che contengono i parametri da passare ai due thread sono dichiarate nel processo padre, il processo padre termina immediatamente e tutte le sue variabili verranno deallocata comprese quelle passate come argomenti alle funzoni dei thread che accederanno quindi a locazioni di memoria non valide. Per risolvere questo problema dovremmo fare in modo che il processo padre attenda la terminazione dei thread nello stesso modo con cui attraverso la wait()
attendeva la terminazione del processo figlio.
Per fare in modo che il main()
attenda la terminazione dei thread è possibile usare la funzione pthread_join()
. Questo è il suo prototipo:
int pthread_join(pthread_t thread, void **retval);
pthread_t
: id del thread di cui si vuole attendere il completamentovoid *
: puntatore a void per il valore di ritorno del thread. Se non sei interessato al valore di ritorno passaNULL
a questo parametro.
Vediamo come risolvere il bug dell'esempio predente usando la pthread_join()
per attendere il completamento dei thread creati nel main()
/***********************************************************************
* Code listing from "Advanced Linux Programming," by CodeSourcery LLC *
* Copyright (C) 2001 by New Riders Publishing *
* See COPYRIGHT for license information. *
***********************************************************************/
#include <pthread.h>
#include <stdio.h>
/* Parameters to print_function. */
struct char_print_parms
{
/* The character to print. */
char character;
/* The number of times to print it. */
int count;
};
/* Prints a number of characters to stderr, as given by PARAMETERS,
which is a pointer to a struct char_print_parms. */
void* char_print (void* parameters)
{
/* Cast the cookie pointer to the right type. */
struct char_print_parms* p = (struct char_print_parms*) parameters;
int i;
for (i = 0; i < p->count; ++i)
fputc (p->character, stderr);
return NULL;
}
/* The main program. */
int main ()
{
pthread_t thread1_id;
pthread_t thread2_id;
struct char_print_parms thread1_args;
struct char_print_parms thread2_args;
/* Create a new thread to print 30000 x's. */
thread1_args.character = 'x';
thread1_args.count = 30000;
pthread_create (&thread1_id, NULL, &char_print, &thread1_args);
/* Create a new thread to print 20000 o's. */
thread2_args.character = 'o';
thread2_args.count = 20000;
pthread_create (&thread2_id, NULL, &char_print, &thread2_args);
/* Make sure the first thread has finished. */
pthread_join (thread1_id, NULL);
/* Make sure the second thread has finished. */
pthread_join (thread2_id, NULL);
/* Now we can safely return. */
return 0;
}
Se il secondo parametro in ingresso alla pthread_join()
non è NULL
allora il valore di ritorno del thread verrà salvato nella locazione di memoria puntata da quell'argomento. Il valore di ritorno del thread è di tipo puntatore a void: void *
quindi è necessario castare l'indrizzo della variabile intera prime
ad void *
nella chiamata alla pthread_join()
.
/***********************************************************************
* Code listing from "Advanced Linux Programming," by CodeSourcery LLC *
* Copyright (C) 2001 by New Riders Publishing *
* See COPYRIGHT for license information. *
***********************************************************************/
#include <pthread.h>
#include <stdio.h>
/* Compute successive prime numbers (very inefficiently). Return the
Nth prime number, where N is the value pointed to by *ARG. */
void* compute_prime (void* arg)
{
int candidate = 2;
int n = *((int*) arg);
while (1) {
int factor;
int is_prime = 1;
/* Test primality by successive division. */
for (factor = 2; factor < candidate; ++factor)
if (candidate % factor == 0) {
is_prime = 0;
break;
}
/* Is this the prime number we're looking for? */
if (is_prime) {
if (--n == 0)
/* Return the desired prime number as the thread return value. */
return (void*) candidate;
}
++candidate;
}
return NULL;
}
int main ()
{
pthread_t thread;
int which_prime = 5000;
int prime;
/* Start the computing thread, up to the 5000th prime number. */
pthread_create (&thread, NULL, &compute_prime, &which_prime);
/* Do some other work here... */
/* Wait for the prime number thread to complete, and get the result. */
pthread_join (thread, (void*) &prime);
/* Print the largest prime it computed. */
printf("The %dth prime number is %d.\n", which_prime, prime);
return 0;
}
vagrant@ubuntu2204:/lab2/1_threads$ bin/3_primes
The 5000th prime number is 48611.
pthread_self()
ritorna il thread id del thread corrente che la sta eseguendo. Questo è il suo prototipo:
pthread_t pthread_self(void);
pthread_equal()
confronta due thread id(s): ritorna zero se i due ID sono uguali. Questo è il suo prototipo:
int pthread_equal(pthread_t t1, pthread_t t2);
Queste due funzioni possonoe essere utlili per controllare se un certo ID corrisponde a quello del thread corrente per esempio prima di chiamare una pthread_join()
in quanto aspettare la terminazione di se stessi è un grosso errore. Sotto un esempio:
if (!pthread_equal (pthread_self (), other_thread))
pthread_join (other_thread, NULL);
Gli attributi del thread forniscono un meccanismo per la messa a punto del comportamento dei singoli thread. Abbiamo visto come la pthread_create()
accetta un argomento che è un puntatore a un oggetto attributo del thread. Se passi un puntatore nullo a questo argomento, gli attributi predefiniti vengono utilizzati per configurare il nuovo thread. Tuttavia, puoi creare e personalizzare un oggetto attributo thread per specificare altri valori per gli attributi. Per specificare attributi thread personalizzati, devi seguire questi passaggi:
- Crea un oggetto
pthread_attr_t
. Il modo più semplice per farlo èdichiarare una variabile automatica di questo tipo. - Chiama la funzione
pthread_attr_init()
, passando un puntatore a questo oggetto. Ciò inizializza gli attributi ai loro valori predefiniti. - Modifica l'oggetto attributo per contenere i valori attributo desiderati.
- Passa un puntatore all'oggetto attributo che hai valorizzato al punto di sopra quando ruchiami la
pthread_create()
. - Chiama la
pthread_attr_destroy()
per rilasciare l'oggetto attributo. La variabilepthread_attr_t
non viene deallocata; può essere reinizializzata conpthread_attr_init()
Un singolo oggetto attributo thread può essere utilizzato per inizializzare diversi thread. Non è necessario mantenere l'oggetto attributo thread dopo che i thread sono stati creati.
Per la maggior parte delle attività di programmazione delle applicazioni GNU/Linux, un solo attributo thread è in genere di interesse (gli altri attributi disponibili sono principalmente per la programmazione in tempo reale).
Questo attributo è il detach state del thread. Un thread può essere creato come un thread joinable (l'impostazione predefinita) o come un detached thread. Un joinable thread, come un processo, non viene automaticamente ripulito da GNU/Linux quando termina e lo stato di uscita del thread rimane sospeso nel sistema (un po' come un processo zombie) finché un altro thread non richiama la pthread_join()
per ottenere il suo valore di ritorno. Solo allora le sue risorse vengono rilasciate. Un detached thread, al contrario, viene ripulito automaticamente quando termina. Poiché un detache thread viene immediatamente ripulito, un altro thread potrebbe non sincronizzarsi al suo completamento tramite pthread_join()
o ottenere il suo valore di ritorno.
Per impostare lo stato detacjed in un oggetto attributo thread, basta utilizzare pthread_attr_setdetachstate()
.
Questo è il suo prototipo:
int pthread_attr_setdetachstate(pthread_attr_t *attr, int detachstate);
Il primo argomento è un puntatore all'oggetto attributo thread (pthread_attr_t *
) e il secondo è lo stato detached desiderato. Poiché lo stato joinable è quello predefinito, è necessario chiamare questo solo per creare detached thread passando PTHREAD_CREATE_DETACHED
come secondo argomento.
Il codice di sotto crea un detached thread impostando l'attributo thread a PTHREAD_CREATE_DETACHED
.
/***********************************************************************
* Code listing from "Advanced Linux Programming," by CodeSourcery LLC *
* Copyright (C) 2001 by New Riders Publishing *
* See COPYRIGHT for license information. *
***********************************************************************/
#include <pthread.h>
void* thread_function (void* thread_arg)
{
/* Do work here... */
return NULL;
}
int main ()
{
pthread_attr_t attr;
pthread_t thread;
pthread_attr_init (&attr);
pthread_attr_setdetachstate (&attr, PTHREAD_CREATE_DETACHED);
pthread_create (&thread, &attr, &thread_function, NULL);
pthread_attr_destroy (&attr);
/* Do work here... */
/* No need to join the second thread. */
return 0;
}
Anche se un thread è stato creato con stato joinable può essere imopstato in un secondo momento nello stato detached, per fare questo basta usare la funzione pthread_detach()
. Questo è il suo prototipo:
int pthread_detach(pthread_t thread);
In circostanze normali, un thread termina quando esce normalmente, sia tornando dalla sua funzione thread o chiamando la pthread_exit()
. Tuttavia, è possibile che un thread richieda che un altro thread termini. Questo è chiamato cancellamento di un thread. Per cancellare un thread, chiama la pthread_cancel()
, passando l'ID del thread da cancellare. E' possibile richiamre la pthread_join() su un thread cancellato (di tipo joinable, non è possibile per un thread in stato detaced) per liberarne le risorse, Il valore di ritorno di un thread cancellato è il valore speciale PTHREAD_CANCELED
.
Spesso un thread può essere in un codice che deve essere eseguito in modalità tutto o niente. Ad esempio, il thread può allocare alcune risorse, usarle e quindi deallocarle. Se il thread viene annullato nel mezzo di questo codice, potrebbe non avere l'opportunità di deallocare le risorse, e quindi le risorse saranno perse. Per contrastare questa possibilità, è possibile che un thread controlli se e quando può essere annullato. Un thread può trovarsi in uno dei tre stati per quanto riguarda la cancellazione del thread:
- Il thread può essere cancellabile in modo asincrono. Il thread può essere annullato in qualsiasi momento della sua esecuzione.
- Il thread può essere cancellabile in modo sincrono. Il thread può essere annullato, ma non in qualsiasi momento della sua esecuzione. Invece, le richieste di annullamento vengono messe in coda e il thread viene cancellato solo quando raggiunge punti specifici della sua esecuzione.
- Un thread può essere non cancellabile. I tentativi di cancellare il thread vengono ignorati silenziosamente.
Quando viene creato inizialmente, un thread è cancellabile in modo sincrono
Un thread cancellabile in modo asincrono può essere annullato in qualsiasi momento della sua esecuzione. Un thread cancellabile in modo sincrono, al contrario, può essere cancellato solo in determinati punti della sua esecuzione. Questi punti sono chiamati punti di annullamento. Il thread metterà in coda una richiesta di annullamento finché non raggiunge il punto di annullamento successivo. Per rendere un thread cancellabile in modo asincrono, utilizzare pthread_setcanceltype()
. Questo è il suo prototipo:
int pthread_setcanceltype(int type, int *oldtype);
Il primo argomento dovrebbe essere PTHREAD_CANCEL_ASYNCHRONOUS
per rendere il thread cancellabile in modo asincrono o PTHREAD_CANCEL_DEFERRED
per riportarlo allo stato cancellabile in modo sincrono. Il secondo argomento, se non è nullo, è un puntatore a una variabile che riceverà il tipo di annullamento precedente per il thread. Questa chiamata, ad esempio, rende il thread chiamante cancellabile in modo asincrono.
pthread_setcanceltype (PTHREAD_CANCEL_ASYNCHRONOUS, NULL);
Cosa costituisce un punto di annullamento e dove dovrebbero essere posizionati? Il modo più diretto per creare un punto di annullamento è chiamare pthread_testcancel()
.
void pthread_testcancel(void);
Questa funzione non fa altro che elaborare un annullamento in sospeso in un thread cancellabile in modo sincrono. Dovresti chiamare pthread_testcancel()
periodicamente durante i calcoli lunghi in una funzione thread, nei punti in cui il thread può essere annullato senza perdere risorse o produrre altri effetti negativi. Anche alcune altre funzioni sono implicitamente punti di annullamento. Sono elencate nella pagina man di pthread_cancel()
. Nota che altre funzioni possono utilizzare queste funzioni internamente e quindi saranno indirettamente punti di annullamento.
Un thread può disabilitare del tutto la cancellazione di se stesso con la funzione pthread_setcancelstate()
.
int pthread_setcancelstate(int state, int *oldstate);
Il primo argomento è PTHREAD_CANCEL_DISABLE
per disabilitare la cancellazione o PTHREAD_CANCEL_ENABLE
per riabilitare la cancellazione. Il secondo argomento, se non è nullo,
punta a una variabile che riceverà lo stato di cancellazione precedente. Questa chiamata, ad esempio, disabilita l'annullamento del thread nel thread chiamante.
pthread_setcancelstate (PTHREAD_CANCEL_DISABLE, NULL);
L'utilizzo di pthread_setcancelstate()
consente di implementare sezioni critiche. Una sezione critica è una sequenza di codice che deve essere eseguita per intero o per niente; in altre parole, se un thread inizia a eseguire la sezione critica, deve continuare fino alla fine della sezione critica senza essere annullato. Ad esempio, supponiamo che tu stia scrivendo una routine per un programma bancario che trasferisce denaro da un conto a un altro. Per fare ciò, devi aggiungere valore al saldo di un conto e detrarre lo stesso valore dal saldo di un altro conto. Se il thread che esegue la tua routine venisse annullato proprio nel momento sbagliato tra queste due operazioni, il programma avrebbe aumentato in modo ingiusto i depositi totali della banca non riuscendo a completare la transazione. Per evitare questa possibilità, inserisci le due operazioni in una sezione critica. Potresti implementare il trasferimento con una funzione come process_transaction()
, mostrata sotto. Questa funzione disabilita l'annullamento del thread per avviare una sezione critica prima che modifichi il saldo di uno dei due conti.
/***********************************************************************
* Code listing from "Advanced Linux Programming," by CodeSourcery LLC *
* Copyright (C) 2001 by New Riders Publishing *
* See COPYRIGHT for license information. *
***********************************************************************/
#include <pthread.h>
#include <stdio.h>
#include <string.h>
#include <stdlib.h>
/* Parameters to process_transaction function. */
struct thread_params {
int from;
int to;
float dollars;
};
/* An array of balances in accounts, indexed by account number. */
float* account_balances;
/* Transfer DOLLARS from account FROM_ACCT to account TO_ACCT. Return
0 if the transaction succeeded, or 1 if the balance FROM_ACCT is
too small. */
void* process_transaction (void *args)
{
struct thread_params *p= (struct thread_params *)args;
int from_acct = p->from;
int to_acct = p->to;
float dollars = p->dollars;
int old_cancel_state;
/* Check the balance in FROM_ACCT. */
if (account_balances[from_acct] < dollars)
return (void *)1;
/* Begin critical section. */
pthread_setcancelstate (PTHREAD_CANCEL_DISABLE, &old_cancel_state);
/* Move the money. */
account_balances[to_acct] += dollars;
account_balances[from_acct] -= dollars;
/* End critical section. */
pthread_setcancelstate (old_cancel_state, NULL);
return NULL;
}
int main() {
pthread_t thread_id;
int thread_return_value;
struct thread_params p;
p.from = 0;
p.to = 5;
p.dollars = 9;
account_balances = (float *)malloc(10*sizeof(float));
account_balances[0] = 100;
account_balances[1] = 67;
account_balances[2] = 78;
account_balances[3] = 10;
account_balances[4] = 93;
account_balances[5] = 1;
account_balances[6] = 46;
account_balances[7] = 90;
account_balances[8] = 34;
account_balances[9] = 13;
for(int i=0; i< 10; i++)
printf("[%d] %1.f$\n", i, account_balances[i]);
pthread_create (&thread_id, NULL, &process_transaction, &p);
pthread_join (thread_id, (void *) &thread_return_value);
printf("\n");
for(int i=0; i< 10; i++)
printf("[%d] %1.f$\n", i, account_balances[i]);
return 0;
}
vagrant@ubuntu2204:/lab2/1_threads$ bin/5_critical_section
[0] 100$
[1] 67$
[2] 78$
[3] 10$
[4] 93$
[5] 1$
[6] 46$
[7] 90$
[8] 34$
[9] 13$
[0] 91$
[1] 67$
[2] 78$
[3] 10$
[4] 93$
[5] 10$
[6] 46$
[7] 90$
[8] 34$
[9] 13$
Si noti che è importante ripristinare il vecchio stato di annullamento alla fine della sezione critica piuttosto che impostarlo incondizionatamente su PTHREAD_CANCEL_ENABLE
. Ciò consente di chiamare la funzione process_transaction()
in modo sicuro da un'altra sezione critica, in quel caso la funzione setterà lo stato di annullamento nello stesso modo in cui lo ha trovato.
In generale, è una buona idea non usare la cancellazione del thread per terminare l'esecuzione di un thread, tranne in circostanze insolite. Durante il normale funzionamento, una strategia migliore è quella di indicare al thread che dovrebbe uscire e quindi attendere che il thread esca da solo in modo ordinato. Per far questo è necessario conoscere le tecniche di IPC (Interprocess Communication).
A differenza dei processi, tutti i thread in un singolo programma condividono lo stesso spazio di indirizzamento. Ciò significa che se un thread modifica una posizione nella memoria (ad esempio, una variabile globale), la modifica è visibile a tutti gli altri thread. Ciò consente a più thread di operare sugli stessi dati senza utilizzare meccanismi di comunicazione tra processi. Tuttavia, ogni thread ha il proprio stack di chiamate. Ciò consente a ogni thread di eseguire codice diverso e di chiamare e restituire da subroutine nel modo consueto. Come in un programma a thread singolo, ogni invocazione di una subroutine in ogni thread ha il proprio set di variabili locali, che vengono memorizzate nello stack per quel thread. A volte, tuttavia, è desiderabile duplicare una determinata variabile in modo che ogni thread abbia una copia separata. GNU/Linux supporta ciò fornendo a ogni thread un'area dati specifica per il thread. Le variabili memorizzate in quest'area vengono duplicate per ogni thread e ogni thread può modificare la propria copia di una variabile senza influenzare gli altri thread. Poiché tutti i thread condividono lo stesso spazio di memoria, i dati specifici del thread potrebbero non essere accessibili tramite normali riferimenti alle variabili. GNU/Linux fornisce funzioni speciali per impostare e recuperare valori dall'area dati specifica del thread.
Puoi creare tutti gli elementi dati specifici del thread che vuoi, ognuno di tipo void*. Ogni elemento è referenziato da una chiave. Per creare una nuova chiave, e quindi un nuovo elemento dati per ogni thread, usa pthread_key_create().
int pthread_key_create(pthread_key_t *key, void (*destructor)(void*));
Il primo argomento è un puntatore a una variabile di tipo pthread_key_t. Quel valore chiave può essere usato da ogni thread per accedere alla propria copia dell'elemento dati corrispondente. Il secondo argomento dopo pthread_key_t è una funzione di pulizia (cleanup function). Se passi un puntatore a funzione qui, GNU/Linux chiama automaticamente quella funzione quando il thread esce, passando il valore specifico del thread corrispondente a quella chiave. Ciò è particolarmente utile perché la funzione di pulizia viene chiamata anche se il thread viene annullato in un punto arbitrario della sua esecuzione. Se il valore specifico del thread è null, la funzione di pulizia del thread non viene chiamata. Se non hai bisogno di una funzione di pulizia, puoi passare null invece di un puntatore a funzione. Dopo aver creato una chiave, ogni thread può impostare il suo valore specifico del thread corrispondente a quella chiave chiamando pthread_setspecific().
int pthread_setspecific(pthread_key_t key, const void *value);
Il primo argomento è la chiave e il secondo è il valore specifico del thread (di tipo void*) da memorizzare. Per recuperare un elemento dati specifico del thread, chiama pthread_getspecific(), passando la chiave come argomento.
void *pthread_getspecific(pthread_key_t key);
Supponiamo, ad esempio, che l'applicazione divida un'attività tra più thread. Ogni thread deve avere un file di registro separato, in cui vengono registrati i messaggi di avanzamento per le attività di quel thread. L'area dati specifica del thread è un posto comodo in cui memorizzare il puntatore del file per il file di registro per ogni singolo thread.
/***********************************************************************
* Code listing from "Advanced Linux Programming," by CodeSourcery LLC *
* Copyright (C) 2001 by New Riders Publishing *
* See COPYRIGHT for license information. *
***********************************************************************/
#include <malloc.h>
#include <pthread.h>
#include <stdio.h>
/* The key used to assocate a log file pointer with each thread. */
static pthread_key_t thread_log_key;
/* Write MESSAGE to the log file for the current thread. */
void write_to_thread_log (const char* message)
{
FILE* thread_log = (FILE*) pthread_getspecific (thread_log_key);
fprintf (thread_log, "%s\n", message);
}
/* Close the log file pointer THREAD_LOG. */
void close_thread_log (void* thread_log)
{
fclose ((FILE*) thread_log);
}
void* thread_function (void* args)
{
char thread_log_filename[20];
FILE* thread_log;
/* Generate the filename for this thread's log file. */
sprintf (thread_log_filename, "thread-%d.log", (int) pthread_self ());
/* Open the log file. */
thread_log = fopen (thread_log_filename, "w");
/* Store the file pointer in thread-specific data under thread_log_key. */
pthread_setspecific (thread_log_key, thread_log);
write_to_thread_log ("Thread starting.");
char string_log[20];
sprintf (string_log, "My ID is %d", (int) pthread_self ());
write_to_thread_log (string_log);
return NULL;
}
int main ()
{
int i;
pthread_t threads[5];
/* Create a key to associate thread log file pointers in
thread-specific data. Use close_thread_log to clean up the file
pointers. */
pthread_key_create (&thread_log_key, close_thread_log);
/* Create threads to do the work. */
for (i = 0; i < 5; ++i)
pthread_create (&(threads[i]), NULL, thread_function, NULL);
/* Wait for all threads to finish. */
for (i = 0; i < 5; ++i)
pthread_join (threads[i], NULL);
return 0;
}
La funzione principale in questo programma di esempio crea una chiave per memorizzare il puntatore del file specifico del thread e quindi lo memorizza in thread_log_key. Poiché si tratta di una variabile globale, è condivisa da tutti i thread. Quando ogni thread inizia a eseguire la sua funzione thread, apre un file di registro e memorizza il puntatore del file sotto quella chiave. In seguito, uno qualsiasi di questi thread può chiamare write_to_thread_log() per scrivere un messaggio nel file di registro specifico del thread. Tale funzione recupera il puntatore del file per il file di registro del thread dai dati specifici del thread e scrive il messaggio.
Si noti che thread_function() non ha bisogno di chiudere il file di registro. Questo perché quando è stata creata la chiave del file di registro, close_thread_log() è stato specificato come funzione di pulizia per quella chiave. Ogni volta che un thread esce, GNU/Linux chiama quella funzione, passando il valore specifico del thread per la chiave del registro del thread. Questa funzione si occupa di chiudere il file di registro.
Le funzioni di pulizia per chiavi dati specifiche del thread possono essere molto utili per garantire che le risorse non vengano perse quando un thread esce o viene annullato. A volte, tuttavia, è utile poter specificare funzioni di pulizia senza creare un nuovo elemento dati specifico del thread duplicato per ogni thread. GNU/Linux fornisce gestori di pulizia a questo scopo. Un gestore di pulizia è semplicemente una funzione che dovrebbe essere chiamata quando un thread esce. Il gestore accetta un singolo parametro void* e il suo valore di argomento viene fornito quando il gestore viene registrato, il che semplifica l'utilizzo della stessa funzione del gestore per gestire più istanze di risorse. Un gestore di pulizia è una misura temporanea, utilizzata per deallocare una risorsa solo se il thread esce o viene annullato anziché terminare l'esecuzione di una particolare regione di codice. In circostanze normali, quando il thread non esce e non viene annullato, la risorsa dovrebbe essere deallocata in modo esplicito e il gestore di pulizia dovrebbe essere rimosso. Per registrare un gestore di pulizia, chiama pthread_cleanup_push(), passando un puntatore alla funzione di pulizia e il valore del suo argomento void*. La chiamata a pthread_cleanup_push deve essere bilanciata da una chiamata corrispondente a pthread_cleanup_pop, che annulla la registrazione del gestore di pulizia.
void pthread_cleanup_push(void (*routine)(void *), void *arg);
void pthread_cleanup_pop(int execute);
Per comodità, pthread_cleanup_pop accetta un argomento flag int; se il flag è diverso da zero, l'azione di pulizia viene effettivamente eseguita in quanto annullata. Il frammento di programma di sotto mostra come è possibile utilizzare un gestore di pulizia per assicurarsi che un buffer allocato dinamicamente venga ripulito se il thread termina.
***********************************************************************
* Code listing from "Advanced Linux Programming," by CodeSourcery LLC *
* Copyright (C) 2001 by New Riders Publishing *
* See COPYRIGHT for license information. *
***********************************************************************/
#include <stdio.h>
#include <malloc.h>
#include <pthread.h>
/* Allocate a temporary buffer. */
void* allocate_buffer (size_t size)
{
return malloc (size);
}
/* Deallocate a temporary buffer. */
void deallocate_buffer (void* buffer)
{
printf("Called cleanup handler function\n");
free (buffer);
}
void* do_some_work ()
{
/* Allocate a temporary buffer. */
void* temp_buffer = allocate_buffer (1024);
/* Register a cleanup handler for this buffer, to deallocate it in
case the thread exits or is cancelled. */
pthread_cleanup_push (deallocate_buffer, temp_buffer);
/* Do some work here that might call pthread_exit or might be
cancelled... */
pthread_exit(0);
/* Unregister the cleanup handler. Since we pass a non-zero value,
this actually performs the cleanup by calling
deallocate_buffer. */
pthread_cleanup_pop (1);
return NULL;
}
int main(void){
pthread_t allocator_thread;
pthread_create(&allocator_thread, NULL, do_some_work, NULL);
pthread_join(allocator_thread, NULL);
return 0;
}
La programmazione con i thread è molto complicata perché la maggior parte dei programmi con thread sono programmi concorrenti. In particolare, non c'è modo di sapere quando il sistema pianificherà l'esecuzione di un thread e quando ne eseguirà un altro. Un thread potrebbe essere eseguito per un tempo molto lungo o il sistema potrebbe passare da un thread all'altro molto rapidamente. Su un sistema con più processori, il sistema potrebbe persino pianificare l'esecuzione di più thread letteralmente nello stesso momento. Il debug di un programma con thread è difficile perché non è sempre possibile riprodurre facilmente il comportamento che ha causato il problema. Potresti eseguire il programma una volta e far funzionare tutto correttamente; la volta successiva che lo esegui, potrebbe bloccarsi. Non c'è modo di far pianificare i thread esattamente nello stesso modo in cui lo faceva prima.
La causa ultima della maggior parte dei bug che coinvolgono i thread è che i thread accedono agli stessi dati. Come accennato in precedenza, questo è uno degli aspetti più potenti dei thread, ma può anche essere pericoloso. Se un thread è solo a metà dell'aggiornamento di una struttura dati quando un altro thread accede alla stessa struttura dati, è probabile che si verifichi il caos. Spesso, i programmi con thread buggati contengono un codice che funzionerà solo se un thread viene pianificato più spesso, o prima, di un altro thread. Questi bug sono chiamati race conditions; i thread sono in competizione tra loro per modificare la stessa struttura dati.
Supponiamo che il tuo programma abbia una serie di lavori in coda che vengono elaborati da diversi thread simultanei. La coda dei lavori è rappresentata da una lista di oggetti struct job. Dopo che ogni thread termina un'operazione, controlla la coda per vedere se è disponibile un lavoro aggiuntivo. Se job_queue è diverso da null, il thread rimuove la testa dell'elenco collegato e imposta job_queue sul lavoro successivo nell'elenco.
Ora supponiamo che due thread finiscano un lavoro più o meno nello stesso momento, ma che solo un lavoro rimanga nella coda. Il primo thread controlla se job_queue è nullo; scoprendo che non lo è, il thread entra nel ciclo e memorizza il puntatore all'oggetto lavoro in next_job. A questo punto, Linux interrompe il primo thread e pianifica il secondo. Anche il secondo thread controlla job_queue e, trovandolo non nullo, assegna lo stesso puntatore lavoro a next_job. Per una sfortunata coincidenza, ora abbiamo due thread che eseguono lo stesso lavoro. A peggiorare le cose, un thread scollegherà l'oggetto lavoro dalla coda, lasciando job_queue contenente null. Quando l'altro thread valuta job_queue->next, si verificherà un errore di segmentazione. Questo è un esempio di condizione di gara. In circostanze "fortunate", questa particolare pianificazione dei due thread potrebbe non verificarsi mai e la condizione di gara potrebbe non manifestarsi mai. Solo in circostanze diverse, magari quando si esegue su un sistema pesantemente caricato (o sul nuovo server multiprocessore di un cliente importante!) il bug può manifestarsi. Per eliminare le race conditions, è necessario un modo per rendere le operazioni atomiche. Un'operazione atomica è indivisibile e ininterrotta; una volta avviata, non verrà messa in pausa o interrotta fino al suo completamento e nel frattempo non verrà eseguita nessun'altra operazione. In questo particolare esempio, si desidera controllare job_queue; se non è vuoto, rimuovere il primo lavoro, il tutto come un'unica operazione atomica.
/***********************************************************************
* Code listing from "Advanced Linux Programming," by CodeSourcery LLC *
* Copyright (C) 2001 by New Riders Publishing *
* See COPYRIGHT for license information. *
***********************************************************************/
#include <malloc.h>
#include <pthread.h>
struct job {
/* Link field for linked list. */
struct job* next;
char *message;
/* Other fields describing work to be done... */
};
/* A linked list of pending jobs. */
struct job* job_queue;
void process_job (struct job* tmp){
char print_me[20];
printf("Thread %ld completed job %s \n", pthread_self(), tmp->message);
}
/* Process queued jobs until the queue is empty. */
void* thread_function (void* arg)
{
while (job_queue != NULL) {
/* Get the next available job. */
struct job* next_job = job_queue;
/* Remove this job from the list. */
job_queue = job_queue->next;
/* Carry out the work. */
process_job (next_job);
/* Clean up. */
free (next_job);
}
return NULL;
}
int main(void){
struct job *one = (struct job *) malloc(sizeof(struct job));
struct job *two = (struct job *) malloc(sizeof(struct job));
struct job *three = (struct job *) malloc(sizeof(struct job));
one->message = "1";
two->message = "2";
three->message = "3";
job_queue = (struct job *) malloc(sizeof(struct job));
job_queue->message = "4";
job_queue->next = three;
three->next = two;
two->next = one;
one->next = NULL;
pthread_t first;
pthread_t second;
pthread_create(&first, NULL, thread_function, NULL);
pthread_create(&second, NULL, thread_function, NULL);
pthread_join(first, NULL);
pthread_join(second, NULL);
return 0;
}
La soluzione al problema della race condition della coda dei lavori è consentire a un solo thread alla volta di accedere alla coda dei lavori. Una volta che un thread inizia a guardare la coda, nessun altro thread dovrebbe essere in grado di accedervi finché il primo thread non ha deciso se elaborare un lavoro e, in tal caso, lo ha rimosso dall'elenco. L'implementazione richiede il supporto del sistema operativo. GNU/Linux fornisce i mutex, abbreviazione di blocchi MUTual EXclusion. Un mutex è un blocco speciale che solo un thread può bloccare alla volta. Se un thread blocca un mutex e poi un secondo thread tenta di bloccare lo stesso mutex, il secondo thread viene bloccato o messo in attesa. Solo quando il primo thread sblocca il mutex, il secondo thread viene sbloccato, ovvero può riprendere l'esecuzione. GNU/Linux garantisce che non si verifichino condizioni di gara tra thread che tentano di bloccare un mutex; solo un thread otterrà il blocco e tutti gli altri thread verranno bloccati. Pensa a un mutex come alla serratura di una porta del bagno. Chi arriva per primo entra nel bagno e chiude a chiave la porta. Se qualcun altro tenta di entrare nel bagno mentre è occupato, quella persona troverà la porta chiusa a chiave e sarà costretta ad aspettare fuori finché l'occupante non esce. Per creare un mutex, crea una variabile di tipo pthread_mutex_t e passa un puntatore a pthread_mutex_init(). Il secondo argomento di pthread_mutex_init è un puntatore a un oggetto attributo mutex, che specifica gli attributi del mutex.
int pthread_mutex_init(pthread_mutex_t *restrict mutex, const pthread_mutexattr_t *restrict attr);
Come con pthread_create, se il puntatore dell'attributo è nullo, vengono assunti gli attributi predefiniti. La variabile mutex dovrebbe essere inizializzata solo una volta. Questo frammento di codice dimostra la dichiarazione e l'inizializzazione di una variabile mutex.
pthread_mutex_t mutex;
pthread_mutex_init (&mutex, NULL);
Un altro modo più semplice per creare un mutex con attributi predefiniti è inizializzarlo con il valore speciale PTHREAD_MUTEX_INITIALIZER
. Non è necessaria alcuna chiamata aggiuntiva a pthread_mutex_init. Ciò è particolarmente comodo per le variabili globali
(e, in C++, i membri dati statici). Il frammento di codice precedente avrebbe potuto essere scritto in modo equivalente così:
pthread_mutex_t mutex = PTHREAD_MUTEX_INITIALIZER;
Un thread può tentare di bloccare un mutex chiamando pthread_mutex_lock() su di esso.
- Se il mutex è in stato sbloccato, diventa bloccato e la funzione ritorna immediatamente
- Se il mutex è in stato bloccato da un altro thread, pthread_mutex_lock blocca l'esecuzione e restituisce solo alla fine quando il mutex viene sbloccato dall'altro thread.
Più di un thread può essere bloccato su un mutex bloccato contemporaneamente. Quando il mutex viene sbloccato, solo uno dei thread bloccati (scelto in modo imprevedibile) viene sbloccato e gli viene consentito di bloccare il mutex; gli altri thread rimangono bloccati. Una chiamata a pthread_mutex_unlock() sblocca un mutex. Questa funzione dovrebbe essere sempre chiamata dallo stesso thread che ha bloccato il mutex. L'esempio seguente mostra un'altra versione dell'esempio di coda di lavoro. Ora la coda è protetta da un mutex. Prima di accedere alla coda (sia per lettura che per scrittura), ogni thread blocca prima un mutex. Solo quando l'intera sequenza di controllo della coda e rimozione di un lavoro è completa, il mutex viene sbloccato. Ciò impedisce la race condition descritta in precedenza.
/***********************************************************************
* Code listing from "Advanced Linux Programming," by CodeSourcery LLC *
* Copyright (C) 2001 by New Riders Publishing *
* See COPYRIGHT for license information. *
***********************************************************************/
#include <malloc.h>
#include <pthread.h>
struct job {
/* Link field for linked list. */
struct job* next;
char *message;
/* Other fields describing work to be done... */
};
/* A linked list of pending jobs. */
struct job* job_queue;
void process_job (struct job* tmp){
char print_me[20];
printf("Thread %ld completed job %s \n", pthread_self(), tmp->message);
}
/* A mutex protecting job_queue. */
pthread_mutex_t job_queue_mutex = PTHREAD_MUTEX_INITIALIZER;
/* Process queued jobs until the queue is empty. */
void* thread_function (void* arg)
{
while (1) {
struct job* next_job;
/* Lock the mutex on the job queue. */
pthread_mutex_lock (&job_queue_mutex);
/* Now it's safe to check if the queue is empty. */
if (job_queue == NULL)
next_job = NULL;
else {
/* Get the next available job. */
next_job = job_queue;
/* Remove this job from the list. */
job_queue = job_queue->next;
}
/* Unlock the mutex on the job queue, since we're done with the
queue for now. */
pthread_mutex_unlock (&job_queue_mutex);
/* Was the queue empty? If so, end the thread. */
if (next_job == NULL)
break;
/* Carry out the work. */
process_job (next_job);
/* Clean up. */
free (next_job);
}
return NULL;
}
int main(void){
struct job *one = (struct job *) malloc(sizeof(struct job));
struct job *two = (struct job *) malloc(sizeof(struct job));
struct job *three = (struct job *) malloc(sizeof(struct job));
one->message = "1";
two->message = "2";
three->message = "3";
job_queue = (struct job *) malloc(sizeof(struct job));
job_queue->message = "4";
job_queue->next = three;
three->next = two;
two->next = one;
one->next = NULL;
pthread_t first;
pthread_t second;
pthread_create(&first, NULL, thread_function, NULL);
pthread_create(&second, NULL, thread_function, NULL);
pthread_join(first, NULL);
pthread_join(second, NULL);
return 0;
}
Tutti gli accessi a job_queue (il puntatore dati condiviso) avvengono tra la chiamata a pthread_mutex_lock e la chiamata a pthread_mutex_unlock. Un oggetto job, memorizzato in next_job, è accessibile al di fuori di questa regione solo dopo che l'oggetto è stato rimosso dalla coda ed è quindi inaccessibile ad altri thread. Nota che se la coda è vuota (ovvero, job_queue è null), non usciamo immediatamente dal ciclo perché ciò lascerebbe il mutex bloccato in modo permanente e impedirebbe a qualsiasi altro thread di accedere di nuovo alla coda job. Invece, ricordiamo questo fatto impostando next_job su null ed usciamo solo dopo aver sbloccato il mutex. L'uso del mutex per bloccare job_queue non è automatico; spetta a te aggiungere codice per bloccare il mutex prima di accedere a quella variabile e quindi sbloccarlo in seguito. Ad esempio, una funzione per aggiungere un job alla coda job potrebbe apparire così:
void enqueue_job (struct job* new_job)
{
pthread_mutex_lock (&job_queue_mutex);
new_job->next = job_queue;
job_queue = new_job;
pthread_mutex_unlock (&job_queue_mutex);
}
I mutex forniscono un meccanismo per consentire a un thread di bloccare l'esecuzione di un altro. Ciò apre la possibilità di una nuova classe di bug, chiamati deadlock. **Un deadlock si verifica quando uno o più thread sono bloccati in attesa di qualcosa che non si verificherà mai. Un semplice tipo di deadlock può verificarsi quando lo stesso thread tenta di bloccare un mutex due volte di seguito. Il comportamento in questo caso dipende dal tipo di mutex utilizzato. Esistono tre tipi di mutex:
- Il blocco di un mutex veloce (il tipo predefinito) causerà il verificarsi di un deadlock. Un tentativo di bloccare il mutex si blocca finché il mutex non viene sbloccato. Ma poiché il thread che ha bloccato il mutex è bloccato sullo stesso mutex, il blocco non può mai essere rilasciato.
- Il blocco di un mutex ricorsivo non causa un deadlock. Un mutex ricorsivo può essere bloccato in modo sicuro più volte dallo stesso thread. Il mutex ricorda quante volte pthread_mutex_lock è stato chiamato su di esso dal thread che detiene il blocco; quel thread deve effettuare lo stesso numero di chiamate a pthread_mutex_unlock prima che il mutex venga effettivamente sbloccato e un altro thread possa bloccarlo.
- GNU/Linux rileverà e contrassegnerà un doppio blocco su un mutex di controllo degli errori che altrimenti causerebbe un deadlock. La seconda chiamata consecutiva a pthread_mutex_lock restituisce il codice di errore
EDEADLK
.
Per impostazione predefinita, un mutex GNU/Linux è del tipo veloce. Per creare un mutex di uno degli altri due tipi, crea prima un oggetto attributo mutex dichiarando una variabile pthread_mutexattr_t e chiamando pthread_mutexattr_init(). Poi setta il tipo di mutex chiamando pthread_mutexattr_setkind_np().
int pthread_mutexattr_setkind_np(pthread_mutexattr_t *attr, int kind);
Il primo argomento è un puntatore all'oggetto attributo mutex, e il secondo è PTHREAD_MUTEX_RECURSIVE_NP
per un mutex ricorsivo, o PTHREAD_MUTEX_ERRORCHECK_NP
per un mutex di controllo degli errori. Passa un puntatore a questo oggetto attributo a
pthread_mutex_init() per creare un mutex di questo tipo, quindi distruggi l'oggetto attributo con pthread_mutexattr_destroy(). Questa sequenza di codice illustra la creazione di un mutex di controllo degli errori, ad esempio:
pthread_mutexattr_t attr;
pthread_mutex_t mutex;
pthread_mutexattr_init (&attr);
pthread_mutexattr_setkind_np (&attr, PTHREAD_MUTEX_ERRORCHECK_NP);
pthread_mutex_init (&mutex, &attr);
pthread_mutexattr_destroy (&attr);
Come suggerito dal suffisso "np", i tipi di mutex ricorsivi e di controllo degli errori sono specifici di GNU/Linux e non sono portabili. Pertanto, in genere non è consigliabile utilizzarli nei programmi. (Tuttavia, i mutex di controllo degli errori possono essere utili durante il debug.)
A volte, è utile verificare se un mutex è bloccato senza effettivamente bloccarlo. Ad esempio, un thread potrebbe dover bloccare un mutex ma potrebbe avere altro lavoro da fare invece di bloccare se il mutex è già bloccato. Poiché pthread_mutex_lock() non
tornerà finché il mutex non sarà sbloccato, è necessaria un'altra funzione. GNU/Linux fornisce pthread_mutex_trylock() per questo scopo. Se chiami pthread_mutex_trylock su un mutex sbloccato, bloccherai il mutex come se avessi chiamato pthread_mutex_lock e pthread_mutex_trylock restituirà zero. Tuttavia, se il mutex è già bloccato da un altro thread, pthread_mutex_trylock non bloccherà. Invece, tornerà immediatamente con il codice di errore EBUSY
. Il blocco del mutex mantenuto dall'altro thread non è interessato. Puoi provare di nuovo più tardi a bloccare il mutex.
Nell'esempio precedente, in cui diversi thread elaborano i lavori da una coda, la funzione thread principale dei thread esegue il lavoro successivo finché non ci sono più lavori e quindi esce dal thread. Questo schema funziona se tutti i lavori vengono messi in coda in anticipo o se i nuovi lavori vengono messi in coda almeno con la stessa rapidità con cui i thread li elaborano. Tuttavia, se i thread lavorano troppo velocemente, la coda dei lavori si svuoterà e i thread usciranno. Se in seguito vengono messi in coda nuovi lavori, non ci saranno più thread che li elaborino. Ciò che potremmo invece desiderare è un meccanismo per bloccare i thread quando la coda si svuota finché non diventano disponibili nuovi lavori. Un semaforo fornisce un metodo conveniente per farlo. Un semaforo è un contatore che può essere utilizzato per sincronizzare più thread. Come con un mutex, GNU/Linux garantisce che il controllo o la modifica del valore di un semaforo può essere eseguito in modo sicuro, senza creare una condizione di competizione. Ogni semaforo ha un valore contatore, che è un intero non negativo. Un semaforo supporta due operazioni di base:
- Un'operazione di attesa decrementa il valore del semaforo di 1. Se il valore è già zero, l'operazione si blocca finché il valore del semaforo non diventa positivo (a causa dell'azione di un altro thread). Quando il valore del semaforo diventa positivo, viene decrementato di 1 e l'operazione di attesa ritorna.
- Un'operazione di post incrementa il valore del semaforo di 1. Se il semaforo era precedentemente zero e altri thread sono bloccati in un'operazione di attesa su quel semaforo, uno di quei thread viene sbloccato e la sua operazione di attesa viene completata (il che riporta il valore del semaforo a zero)
Nota che GNU/Linux fornisce due implementazioni di semafori leggermente diverse. Quella che descriviamo qui è l'implementazione standard del semaforo POSIX. Usa questi semafori quando comunichi tra thread. L'altra implementazione, usata per la comunicazione tra processi, Se usi i semafori, includi <semaphore.h>. Un semaforo è rappresentato da una variabile sem_t. Prima di usarla, devi inizializzarla usando la funzione sem_init(), passando un puntatore alla variabile sem_t. Il secondo parametro dovrebbe essere zero (Un valore diverso da zero indicherebbe un semaforo che può essere condiviso tra i processi, il che non è supportato da GNU/Linux per questo tipo di semaforo) e il terzo parametro è il valore iniziale del semaforo.
int sem_init(sem_t *sem, int pshared, unsigned int value);
Se non hai più bisogno di un semaforo, è bene deallocarlo con sem_destroy().
Per attendere un semaforo, usa sem_wait().
int sem_wait(sem_t *sem);
Per inviare a un semaforo, usa sem_post().
int sem_post(sem_t *sem);
Viene fornita anche una funzione di attesa non bloccante, sem_trywait(). È simile a pthread_mutex_trylock: se l'attesa si fosse bloccata perché il valore del semaforo era zero, la funzione restituisce immediatamente, con il valore di errore EAGAIN
, invece di
bloccare.
int sem_trywait(sem_t *sem);
GNU/Linux fornisce anche una funzione per recuperare il valore corrente di un semaforo, sem_getvalue(), che inserisce il valore nella variabile int puntata dal suo secondo argomento.
int sem_getvalue(sem_t *sem, int *sval);
Tuttavia, non dovresti usare il valore del semaforo che ottieni da questa funzione per prendere una decisione se inviare o attendere il semaforo. Ciò potrebbe portare a una race condition: un altro thread potrebbe modificare il valore del semaforo tra la chiamata a sem_getvalue e la chiamata a un'altra funzione del semaforo. Utilizza invece le funzioni atomiche di post e attesa. Tornando al nostro esempio di coda di lavoro, possiamo usare un semaforo per contare il numero di lavori in attesa nella coda. L'esempio seguente controlla la coda con un semaforo. La funzione enqueue_job aggiunge un nuovo job alla coda.
/***********************************************************************
* Code listing from "Advanced Linux Programming," by CodeSourcery LLC *
* Copyright (C) 2001 by New Riders Publishing *
* See COPYRIGHT for license information. *
***********************************************************************/
#include <malloc.h>
#include <pthread.h>
#include <semaphore.h>
#include <unistd.h> // sleep
struct job {
/* Link field for linked list. */
struct job* next;
char *message;
/* Other fields describing work to be done... */
};
/* A linked list of pending jobs. */
struct job* job_queue;
void process_job (struct job* tmp){
char print_me[20];
printf("Thread %ld completed job %s \n", pthread_self(), tmp->message);
}
/* A mutex protecting job_queue. */
pthread_mutex_t job_queue_mutex = PTHREAD_MUTEX_INITIALIZER;
/* A semaphore counting the number of jobs in the queue. */
sem_t job_queue_count;
/* Perform one-time initialization of the job queue. */
void initialize_job_queue ()
{
/* The queue is initially empty. */
job_queue = NULL;
/* Initialize the semaphore which counts jobs in the queue. Its
initial value should be zero. */
sem_init (&job_queue_count, 0, 0);
}
/* Process queued jobs until the queue is empty. */
void* thread_function (void* arg)
{
while (1) {
struct job* next_job;
/* Wait on the job queue semaphore. If its value is positive,
indicating that the queue is not empty, decrement the count by
one. If the queue is empty, block until a new job is enqueued. */
sem_wait (&job_queue_count);
/* Lock the mutex on the job queue. */
pthread_mutex_lock (&job_queue_mutex);
/* Because of the semaphore, we know the queue is not empty. Get
the next available job. */
next_job = job_queue;
/* Remove this job from the list. */
job_queue = job_queue->next;
/* Unlock the mutex on the job queue, since we're done with the
queue for now. */
pthread_mutex_unlock (&job_queue_mutex);
/* Carry out the work. */
process_job (next_job);
/* Clean up. */
free (next_job);
}
return NULL;
}
/* Add a new job to the front of the job queue. */
void enqueue_job (char *message)
{
struct job* new_job;
/* Allocate a new job object. */
new_job = (struct job*) malloc (sizeof (struct job));
/* Set the other fields of the job struct here... */
new_job->message = message;
/* Lock the mutex on the job queue before accessing it. */
pthread_mutex_lock (&job_queue_mutex);
/* Place the new job at the head of the queue. */
new_job->next = job_queue;
job_queue = new_job;
/* Post to the semaphore to indicate another job is available. If
threads are blocked, waiting on the semaphore, one will become
unblocked so it can process the job. */
sem_post (&job_queue_count);
/* Unlock the job queue mutex. */
pthread_mutex_unlock (&job_queue_mutex);
}
int main(void){
enqueue_job("1");
enqueue_job("2");
enqueue_job("3");
enqueue_job("4");
pthread_t first;
pthread_t second;
pthread_create(&first, NULL, thread_function, NULL);
pthread_create(&second, NULL, thread_function, NULL);
sleep(60);
enqueue_job("5");
enqueue_job("6");
enqueue_job("7");
enqueue_job("8");
pthread_join(first, NULL);
pthread_join(second, NULL);
return 0;
}
Prima di prendere un lavoro dalla parte anteriore della coda, ogni thread attenderà prima sul semaforo. Se il valore del semaforo è zero, indicando che la coda è vuota, il thread si bloccherà semplicemente finché il valore del semaforo non diventerà positivo, indicando che un lavoro è stato aggiunto alla coda. La funzione enqueue_job aggiunge un lavoro alla coda. Proprio come thread_function, deve bloccare il mutex della coda prima di modificare la coda. Dopo aver aggiunto un lavoro alla coda, invia un post al semaforo, indicando che un nuovo lavoro è disponibile. In questa implementazione i thread che elaborano i lavori non escono mai; se nessun lavoro è disponibile per un po', tutti i thread si bloccano semplicemente in sem_wait.
Abbiamo mostrato come usare un mutex per proteggere una variabile dall'accesso simultaneo da due thread e come usare i semafori per implementare un contatore condiviso. Una variabile di condizione è un terzo dispositivo di sincronizzazione fornito da GNU/Linux; con essa, puoi implementare condizioni più complesse in base alle quali i thread vengono eseguiti. Supponiamo di scrivere una funzione thread che esegue un ciclo all'infinito, eseguendo un po' di lavoro a ogni iterazione. Il ciclo thread, tuttavia, deve essere controllato da un flag: il ciclo viene eseguito solo quando il flag è impostato; quando il flag non è impostato, il ciclo si interrompe. Durante ogni iterazione del ciclo, la funzione thread verifica che il flag sia impostato. Poiché il flag è accessibile da più thread, è protetto da un mutex. Questa implementazione potrebbe essere corretta, ma non è efficiente. La funzione thread impiegherà molta CPU ogni volta che il flag non è impostato, controllando e ricontrollando il flag, ogni volta bloccando e sbloccando il mutex. Ciò che si desidera realmente è un modo per mettere il thread in modalità sleep quando il flag non è impostato, finché non cambiano alcune circostanze che potrebbero causare l'impostazione del flag.
/***********************************************************************
* Code listing from "Advanced Linux Programming," by CodeSourcery LLC *
* Copyright (C) 2001 by New Riders Publishing *
* See COPYRIGHT for license information. *
***********************************************************************/
#include <pthread.h>
extern void do_work ();
int thread_flag;
pthread_mutex_t thread_flag_mutex;
void initialize_flag ()
{
pthread_mutex_init (&thread_flag_mutex, NULL);
thread_flag = 0;
}
/* Calls do_work repeatedly while the thread flag is set; otherwise
spins. */
void* thread_function (void* thread_arg)
{
while (1) {
int flag_is_set;
/* Protect the flag with a mutex lock. */
pthread_mutex_lock (&thread_flag_mutex);
flag_is_set = thread_flag;
pthread_mutex_unlock (&thread_flag_mutex);
if (flag_is_set)
do_work ();
/* Else don't do anything. Just loop again. */
}
return NULL;
}
/* Sets the value of the thread flag to FLAG_VALUE. */
void set_thread_flag (int flag_value)
{
/* Protect the flag with a mutex lock. */
pthread_mutex_lock (&thread_flag_mutex);
thread_flag = flag_value;
pthread_mutex_unlock (&thread_flag_mutex);
}
Una variabile di condizione consente di implementare una condizione in base alla quale un thread viene eseguito e, inversamente, la condizione in base alla quale il thread viene bloccato. Finché ogni thread che potenzialmente modifica il senso della condizione utilizza la variabile di condizione correttamente, Linux garantisce che i thread bloccati sulla condizione verranno sbloccati quando la condizione cambia. Come con un semaforo, un thread può attendere una variabile di condizione. Se il thread A attende una variabile di condizione, viene bloccato finché un altro thread, il thread B, segnala la stessa variabile di condizione. A differenza di un semaforo, una variabile di condizione non ha un contatore o una memoria; il thread A deve attendere la variabile di condizione prima che il thread B la segnali. Se il thread B segnala la variabile di condizione prima che il thread A la attenda, il segnale viene perso e il thread A si blocca finché un altro thread non segnala di nuovo la variabile di condizione. Ecco come utilizzeresti una variabile di condizione per rendere più efficiente l'esempio precedente:
- Il ciclo in thread_function controlla il flag. Se il flag non è impostato, il thread attende la variabile di condizione.
- La funzione set_thread_flag segnala la variabile di condizione dopo aver modificato il valore del flag. In questo modo, se thread_function è bloccato sulla variabile di condizione, verrà sbloccato e controllerà di nuovo la condizione.
C'è un problema con questo: c'è una condizione di competizione tra il controllo del valore del flag e la segnalazione o l'attesa della variabile di condizione. Supponiamo che thread_function abbia controllato il flag e abbia scoperto che non era impostato. In quel momento, lo scheduler di Linux ha messo in pausa quel thread e ha ripreso quello principale. Per una coincidenza, il thread principale è in set_thread_flag. Imposta il flag e quindi segnala la variabile di condizione. Poiché nessun thread è in attesa della variabile di condizione in quel momento (ricorda che thread_function è stato messo in pausa prima di poter attendere la variabile di condizione), il segnale viene perso. Ora, quando Linux riprogramma l'altro thread, inizia ad attendere la variabile di condizione e potrebbe finire bloccato per sempre. Per risolvere questo problema, abbiamo bisogno di un modo per bloccare il flag e la variabile di condizione insieme con un singolo mutex. Fortunatamente, GNU/Linux fornisce esattamente questo meccanismo. Ogni variabile di condizione deve essere utilizzata insieme a un mutex, per impedire questo tipo di race condition. Utilizzando questo schema, la funzione thread segue questi passaggi:
- Il ciclo in thread_function blocca il mutex e legge il valore del flag.
- Se il flag è impostato, sblocca il mutex ed esegue la funzione di lavoro.
- Se il flag non è impostato, sblocca atomicamente il mutex e attende la variabile di condizione.
La caratteristica critica qui è nel passaggio 3, in cui GNU/Linux consente di sbloccare il mutex e attendere la variabile di condizione atomicamente, senza la possibilità che un altro thread intervenga. Ciò elimina la possibilità che un altro thread possa modificare il valore del flag e segnalare la variabile di condizione tra il test del valore del flag e l'attesa della variabile di condizione di thread_function
Una variabile di condizione è rappresentata da un'istanza di pthread_cond_t. Ricorda che ogni variabile di condizione deve essere accompagnata da un mutex. Queste sono le funzioni che manipolano le variabili di condizione:
-
pthread_cond_init() inizializza una variabile di condizione. Il primo argomento è un puntatore a un'istanza di pthread_cond_t. Il secondo argomento, un puntatore a un oggetto attributo di variabile di condizione, viene ignorato in GNU/Linux. Il mutex deve essere inizializzato separatamente
int pthread_cond_init(pthread_cond_t *restrict cond, const pthread_condattr_t *restrict attr);
-
pthread_cond_signal() segnala una variabile di condizione. Un singolo thread bloccato sulla variabile di condizione verrà sbloccato. Se nessun altro thread è bloccato sulla variabile di condizione, il segnale viene ignorato. L'argomento è un puntatore all'istanza di pthread_cond_t. Una chiamata simile, pthread_cond_broadcast(), sblocca tutti i thread bloccati sulla variabile di condizione, invece di uno solo.
int pthread_cond_signal(pthread_cond_t *cond);
int pthread_cond_broadcast(pthread_cond_t *cond);
-
pthread_cond_wait() blocca il thread chiamante finché la variabile di condizione non viene segnalata. L'argomento è un puntatore all'istanza pthread_cond_t. Il secondo argomento è un puntatore all'istanza del mutex pthread_mutex_t. Quando viene chiamata pthread_cond_wait, il mutex deve essere già bloccato dal thread chiamante. Quella funzione sblocca atomicamente il mutex e blocca la variabile di condizione. Quando la variabile di condizione viene segnalata e il thread chiamante si sblocca, pthread_cond_wait riacquisisce automaticamente un blocco sul mutex.
int pthread_cond_wait(pthread_cond_t *restrict cond, pthread_mutex_t *restrict mutex);
Ogni volta che il programma esegue un'azione che potrebbe cambiare il senso della condizione che stai proteggendo con la variabile di condizione, dovrebbe eseguire questi passaggi. (Nel nostro esempio, la condizione è lo stato del flag del thread, quindi questi passaggi devono essere eseguiti ogni volta che il flag viene modificato.)
- Bloccare il mutex che accompagna la variabile di condizione.
- Eseguire l'azione che potrebbe modificare il senso della condizione (nel nostro esempio, impostare il flag).
- Segnalare o trasmettere la variabile di condizione, a seconda del comportamento desiderato.
- Sbloccare il mutex che accompagna la variabile di condizione.
Il codice di sotto mostra di nuovo l'esempio precedente, che ora utilizza una variabile di condizione per proteggere il flag del thread. Notare che in thread_function, un blocco sul mutex viene mantenuto prima di controllare il valore di thread_flag. Tale blocco viene automaticamente rilasciato da pthread_cond_wait prima del blocco e viene automaticamente riacquisito in seguito. Notare inoltre che set_thread_flag blocca il mutex prima di impostare il valore di thread_flag e di segnalare il mutex
/***********************************************************************
* Code listing from "Advanced Linux Programming," by CodeSourcery LLC *
* Copyright (C) 2001 by New Riders Publishing *
* See COPYRIGHT for license information. *
***********************************************************************/
#include <pthread.h>
extern void do_work ();
int thread_flag;
pthread_cond_t thread_flag_cv;
pthread_mutex_t thread_flag_mutex;
void initialize_flag ()
{
/* Initialize the mutex and condition variable. */
pthread_mutex_init (&thread_flag_mutex, NULL);
pthread_cond_init (&thread_flag_cv, NULL);
/* Initialize the flag value. */
thread_flag = 0;
}
/* Calls do_work repeatedly while the thread flag is set; blocks if
the flag is clear. */
void* thread_function (void* thread_arg)
{
/* Loop infinitely. */
while (1) {
/* Lock the mutex before accessing the flag value. */
pthread_mutex_lock (&thread_flag_mutex);
while (!thread_flag)
/* The flag is clear. Wait for a signal on the condition
variable, indicating the flag value has changed. When the
signal arrives and this thread unblocks, loop and check the
flag again. */
pthread_cond_wait (&thread_flag_cv, &thread_flag_mutex);
/* When we've gotten here, we know the flag must be set. Unlock
the mutex. */
pthread_mutex_unlock (&thread_flag_mutex);
/* Do some work. */
do_work ();
}
return NULL;
}
/* Sets the value of the thread flag to FLAG_VALUE. */
void set_thread_flag (int flag_value)
{
/* Lock the mutex before accessing the flag value. */
pthread_mutex_lock (&thread_flag_mutex);
/* Set the flag value, and then signal in case thread_function is
blocked, waiting for the flag to become set. However,
thread_function can't actually check the flag until the mutex is
unlocked. */
thread_flag = flag_value;
pthread_cond_signal (&thread_flag_cv);
/* Unlock the mutex. */
pthread_mutex_unlock (&thread_flag_mutex);
}
La condizione protetta da una variabile di condizione può essere arbitrariamente complessa. Tuttavia, prima di eseguire qualsiasi operazione che possa modificare il senso della condizione, dovrebbe essere richiesto un blocco mutex e la variabile di condizione dovrebbe essere segnalata in seguito. Una variabile di condizione può anche essere utilizzata senza una condizione, semplicemente come meccanismo per bloccare un thread finché un altro thread non lo "sveglia". Anche un semaforo può essere utilizzato a tale scopo. La differenza principale è che un semaforo "ricorda" la chiamata di sveglia anche se nessun thread è stato bloccato su di esso in quel momento, mentre una variabile di condizione scarta la chiamata di sveglia a meno che un thread non sia effettivamente bloccato su di essa in quel momento. Inoltre, un semaforo fornisce solo una singola sveglia per post; con pthread_cond_broadcast, un numero arbitrario e sconosciuto di thread bloccati può essere risvegliato contemporaneamente.
I deadlock possono verificarsi quando due (o più) thread sono bloccati, in attesa che si verifichi una condizione che solo l'altro può causare. Ad esempio, se il thread A è bloccato su una variabile di condizione in attesa che il thread B lo segnali, e il thread B è bloccato su una variabile di condizione in attesa che il thread A lo segnali, si è verificato un deadlock perché nessuno dei due thread segnalerà mai l'altro. Dovresti fare attenzione a evitare la possibilità di tali situazioni perché sono piuttosto difficili da rilevare. Un errore comune che può causare un deadlock riguarda un problema in cui più thread stanno tentando di bloccare lo stesso set di oggetti. Ad esempio, considera un programma in cui due thread diversi, che eseguono due funzioni di thread diverse, devono bloccare gli stessi due mutex. Supponiamo che il thread A blocchi il mutex 1 e poi il mutex 2, e che il thread B blocchi il mutex 2 prima del mutex 1. In uno scenario di pianificazione sufficientemente sfortunato, Linux potrebbe pianificare il thread A abbastanza a lungo da bloccare il mutex 1, e quindi pianificare il thread B, che blocca prontamente il mutex 2. Ora nessuno dei due thread può procedere perché ognuno è bloccato su un mutex che l'altro thread tiene bloccato. Questo è un esempio di un problema di deadlock più generale, che può coinvolgere non solo oggetti di sincronizzazione come i mutex, ma anche altre risorse, come blocchi su file o dispositivi. Il problema si verifica quando più thread tentano di bloccare lo stesso set di risorse in ordini diversi. La soluzione è assicurarsi che tutti i thread che bloccano più risorse le blocchino nello stesso ordine.
L'implementazione dei thread POSIX su GNU/Linux differisce dall'implementa zione dei thread su molti altri sistemi simili a UNIX in un modo importante: su GNU/Linux, i thread sono implementati come processi. Ogni volta che chiami pthread_create per creare un nuovo thread, Linux crea un nuovo processo che esegue quel thread. Tuttavia, questo processo non è lo stesso di un processo che creeresti con fork; in particolare, condivide lo stesso spazio di indirizzamento e le stesse risorse del processo originale anziché ricevere copie. Il programma mostrato sotto lo dimostra. Il programma crea un thread; sia il thread originale che quello nuovo chiamano la funzione getpid e stampano i rispettivi ID di processo e quindi ruotano all'infinito.
/***********************************************************************
* Code listing from "Advanced Linux Programming," by CodeSourcery LLC *
* Copyright (C) 2001 by New Riders Publishing *
* See COPYRIGHT for license information. *
***********************************************************************/
#include <pthread.h>
#include <stdio.h>
#include <unistd.h>
void* thread_function (void* arg)
{
fprintf (stderr, "child thread pid is %d\n", (int) getpid ());
/* Spin forever. */
while (1);
return NULL;
}
int main ()
{
pthread_t thread;
fprintf (stderr, "main thread pid is %d\n", (int) getpid ());
pthread_create (&thread, NULL, &thread_function, NULL);
/* Spin forever. */
while (1);
return 0;
}
Esegui il programma in background, quindi richiama ps x
per visualizzare i processi in esecuzione. Non dimenticare di terminare il programma thread-pid in seguito: consuma molta CPU senza fare nulla. Ecco come potrebbe apparire l'output:
% gcc -o thread-pid thread-pid.c -lpthread
% ./thread-pid &
[1] 14608
main thread pid is 14608
child thread pid is 14610
% ps x
PID TTY STAT TIME COMMAND
14042 pts/9 S 0:00 bash
14608 pts/9 R 0:01 ./thread-pid
14609 pts/9 S 0:00 ./thread-pid
14610 pts/9 R 0:01 ./thread-pid
14611 pts/9 R 0:00 ps x
% kill 14608
[1]+ Terminated ./thread-pid
Note
Notifica del controllo del job nella shell Le righe che iniziano con [1] provengono dalla shell. Quando esegui un programma in background, la shell gli assegna un numero di job, in questo caso 1, e stampa il pid del programma. Se un job in background termina, la shell segnala tale fatto la volta successiva che invochi un comando
Nota che ci sono tre processi che eseguono il programma thread-pid. Il primo di questi, con pid 14608, è il thread principale nel programma; il terzo, con pid 14610, è il thread che abbiamo creato per eseguire thread_function. E il secondo thread, con pid 14609? Questo è il "thread del gestore", che fa parte dell'implementazione interna dei thread GNU/Linux. Il thread del gestore viene creato la prima volta che un programma chiama pthread_create per creare un nuovo thread.
Supponiamo che un programma multithread riceva un segnale. In quale thread viene invocato il gestore del segnale? Il comportamento dell'interazione tra segnali e thread varia da un sistema UNIX a un altro. In GNU/Linux, il comportamento è dettato dal fatto che i thread sono implementati come processi. Poiché ogni thread è un processo separato e poiché un segnale viene inviato a un processo particolare, non vi è ambiguità su quale thread riceva il segnale. In genere, i segnali inviati dall'esterno del programma vengono inviati al processo corrispondente al thread principale del programma. Ad esempio, se un programma si biforca e il processo figlio esegue un programma multithread, il processo padre conterrà l'ID processo del thread principale del programma del processo figlio e utilizzerà tale ID processo per inviare segnali al suo figlio. Questa è in genere una buona convenzione da seguire quando si inviano segnali a un programma multithread. Si noti che questo aspetto dell'implementazione di pthreads di GNU/Linux è in contrasto con lo standard di thread POSIX. Non fare affidamento su questo comportamento in programmi che sono pensati per essere portabili. All'interno di un programma multithread, è possibile che un thread invii un segnale specificamente a un altro thread. Utilizzare la funzione pthread_kill() per farlo. Il suo primo parametro è un ID thread e il suo secondo parametro è un numero di segnale
pthread_kill(pthread_t thread, int sig);
Sebbene i thread GNU/Linux creati nello stesso programma siano implementati come processi separati, condividono il loro spazio di memoria virtuale e altre risorse. Un processo figlio creato con fork, tuttavia, ottiene copie di questi elementi. Come viene creato il primo tipo di processo? La chiamata di sistema clone di Linux è una forma generalizzata di fork e pthread_create che consente al chiamante di specificare quali risorse sono condivise tra il processo chiamante e il processo appena creato. Inoltre, clone richiede di specificare la regione di memoria per lo stack di esecuzione che il nuovo processo utilizzerà. Sebbene menzioniamo clone qui per soddisfare la curiosità del lettore, quella chiamata di sistema non dovrebbe essere normalmente utilizzata nei programmi. Utilizzare fork per creare nuovi processi o pthread_create per creare thread.
Per alcuni programmi che traggono vantaggio dalla concorrenza, la decisione se utilizzare processi o thread può essere difficile. Ecco alcune linee guida per aiutarti a decidere quale modello di concorrenza si adatta meglio al tuo programma:
*Tutti i thread in un programma devono eseguire lo stesso eseguibile. Un processo figlio, d'altra parte, può eseguire un eseguibile diverso chiamando una funzione exec.
- Un thread errante può danneggiare altri thread nello stesso processo perché i thread condividono lo stesso spazio di memoria virtuale e altre risorse. Ad esempio, una scrittura di memoria selvaggia tramite un puntatore non inizializzato in un thread può danneggiare la memoria visibile a un altro thread. Un processo errante, d'altra parte, non può farlo perché ogni processo ha una copia dello spazio di memoria del programma.
- La copia della memoria per un nuovo processo aggiunge un ulteriore sovraccarico di prestazioni rispetto alla creazione di un nuovo thread. Tuttavia, la copia viene eseguita solo quando la memoria viene modificata, quindi la penalità è minima se il processo figlio legge solo la memoria.
- I thread dovrebbero essere utilizzati per i programmi che necessitano di un parallelismo a grana fine. Ad esempio, se un problema può essere suddiviso in più attività quasi identiche, i thread potrebbero essere una buona scelta. I processi dovrebbero essere utilizzati per i programmi che necessitano di un parallelismo più grossolano.
- La condivisione dei dati tra thread è banale perché i thread condividono la stessa memoria. (Tuttavia, è necessario prestare molta attenzione per evitare race condition, come descritto in precedenza.) La condivisione dei dati tra processi richiede l'uso di meccanismi IPC. Ciò può essere più macchinoso, ma rende i processi multipli meno inclini a soffrire di bug di concorrenza