Individu | Nom | Race | Age | Sexe | Poids |
1 | Bill | Teckel | 10 | M | 9 |
2 | Tex | Chihuahua | 8 | M | 3 |
3 | Daisy | Bichon | 6 | F | 5 |
4 | Max | Caniche | 7 | M | 6 |
5 | Reine | Teckel | 8 | F | 7 |
6 | Joy | Caniche | 6 | F | 6 |
7 | Medor | Chihuahua | 9 | M | 4 |
8 | Colossus | Bichon | 5 | M | 4 |
9 | Flute | Teckel | 6 | F | 7 |
10 | Stick | Caniche | 9 | M | 6 |
Signalons d'emblée qu'ils existent d'autres options que celle fournie dans cette définition (par exemple sur la manière de gérer les données manquantes), et qu'il existe d'autres fontions de lectures permettant un accès plus simple à certains formats (par exemple, read.csv pour lire des données dans le format csv). Dans la définition, 'fichier' est le nom du fichier (texte) à considérer, 'header=TRUE' ('header=FALSE') spécifie si la première ligne du fichier (ne) contient (pas) les titres des colonnes (qui deviennent alors les noms des variables du data frame), 'sep=char' permet de fournir le caractère séparant les champs successifs dans le fichier texte, 'quote=char' permet de fournir le caractère entourant les chaines de caractères, et 'dec=char' permet de définir le caractère faisant office de point décimal. Chacune de ces options possède une valeur par défaut: 'header=FALSE, sep=" ", quote="\" ' ", dec="." ' (comme le caractère double-guillemet est un caractère spécial en R, on peut l'utiliser comme caractère en le précédant de '\': le défaut pour 'quote' est donc soit le double-guillemet, soit le simple guillemet). Par conséquent, si on voulait lire le fichier ci-dessus, nommé 'donnees.txt', on pourrait écrire:
data<-read.table("donnees.txt", header=TRUE, sep="\t", quote="")
data
## Individu Nom Race Age Sexe Poids
## 1 1 Bill Teckel 10 M 9
## 2 2 Tex Chihuahua 8 M 3
## 3 3 Daisy Bichon 6 F 5
## 4 4 Max Caniche 7 M 6
## 5 5 Reine Teckel 8 F 7
## 6 6 Joy Caniche 6 F 6
## 7 7 Medor Chihuahua 9 M 4
## 8 8 Coloss Bichon 5 M 4
## 9 9 Flute Teckel 6 F 7
## 10 10 Stick Caniche 9 M 6
data$Sexe
## [1] M M F M F F M M F M
## Levels: F M
Dans cette définition, 'fichier' est un nom de fichier (ou la console si "" est spécifié), les défauts pour quote, row.names et col.names sont 'TRUE' (donc, les chaines de caractères seront entre guillemets, les numéros de lignes seront reportés et les noms des colonnes aussi) et le défaut pour 'append' est 'FALSE' (les données du data frame 'x' remplaceront les données éventuellement présentes dans le fichier de sortie. Si 'append=TRUE' est spécifiée, les donnée sont alors ajoutées à la fin du fichier. Nous allons illustrer le fonctionnement sur le petit exemple suivant:
sex<-c(rep("M",5), rep("F",5))
sex
## [1] "M" "M" "M" "M" "M" "F" "F" "F" "F" "F"
weigth<-c(rnorm(5,20,4), rnorm(5,18,4))
data<-data.frame(sex,weigth)
write.table(data,"donnees2.txt", sep=";", dec=",", quote=FALSE)
Si votre commande est correcte, vous ne verrez rien apparaître dans R. Par contre, si vous ne mentionnez pas le nom du fichier où vos données doivent être enregistrées (dans ce cas-ci, "donnees2.txt"), votre tableau apparaîtra simplement dans R.