Le crabe royal du Kamtchatka, également connu sous le nom de red king crab (Paralithodes camtschaticus), est une espèce de crustacé décapode appartenant à la famille des Lithodidae. On les trouve dans les eaux froides de l’océan Pacifique Nord, principalement dans les régions proches de l’Alaska, de la Russie et du Japon. Ils préfèrent les fonds marins riches en nutriments à des profondeurs allant jusqu’à plusieurs centaines de mètres. Ces crustacés ont une carapace dure et massive, pouvant atteindre une envergure importante. Ils se caractérisent par leurs pinces robustes et puissantes, utilisées pour la capture de proies et la défense. Leur régime alimentaire varie, mais il inclut généralement des mollusques, des petits poissons et d’autres organismes marins.
P.camtschaticus est célèbre pour sa chair délicate et savoureuse, ce qui en fait une espèce très prisée dans le secteur de la pêche commerciale. La pêche au crabe royal est une activité économiquement importante pour les communautés côtières de l’Alaska, de la Russie et d’autres régions où ces crustacés sont abondants. Ils sont exportés dans le monde entier pour répondre à la demande croissante de fruits de mer de qualité. La chair ferme et sucrée du crabe royal en fait un produit recherché sur le marché international. De ce fait, une gestion durable de la pêche au crabe royal est cruciale pour préserver les populations et les écosystèmes marins. Des mesures de conservation strictes sont mises en œuvre pour assurer la durabilité de cette ressource précieuse. Pour pouvoir instaurer un quota de pêche chaque année, le Département de la Pêche et du Jeu de l’Alaska réalise un important échantillonnage de P.camtschaticus dans les zones de pêche.
La zone d’étude dans laquelle ont été collectées les données mises à notre disposition est l’archipel de Kodiak, situé au sud de l’Alaska, au nord de l’océan Pacifique. Les îles Kodiak s’étendent sur environ 9 300 kilomètres carrés avec une topographie variée, comprenant des montagnes, des fjords, des rivières et des vallées. La pêche y joue un rôle essentiel dans l’économie, la région est particulièrement connue pour sa pêche au saumon, au crabe et à d’autres fruits de mer.
La carte ci-dessous représente l’île et l’emplacement des différents
points de collecte en fonction des années (données provenant du fichier
survey
et map
). Les zones de pêches sont
organisées en quatre districts autour de l’île. Chaque point représente
un échantillonnage (une ligne de pêche composées de plusieurs casiers),
la taille des points est proportionnelle au nombre de crabes
échantillonnés.
Tous les ensembles de données, sauf la salinité
(salinity
) et la température (celsius
), ont
été fournis par le Département de la Pêche et du Jeu de l’Alaska. Les
données de salinité et de température proviennent de Tom Royer de
l’Institut des Sciences Marines à l’Université d’Alaska à Fairbanks,. Il
y a aussi des statistiques sur la flotte de pêche et les captures
commerciales (fleet
et catch
), pour chaque
année entre 1960 et 1982. Certaines données de pêche sont réparties par
district (les 4 zones colorées sur la carte).
Avant toute chose, de nombreuses modifications ont été nécessaires pour rendre les données exploitables. Il a fallu ranger, organiser et transformer les données afin de pouvoir les visualiser graphiquement et les analyser statistiquement. Nous avons également regroupé le plus possible l’ensemble des jeux de donnée et calculé des moyennes annuelles lorsque les données disponibles étaient exprimées par année. Nous avons également ajouté des saisons aux mesures de salinité et de température afin de prendre en compte la variation de température pendant ces périodes.
De nouvelles variables sont également créées, telles que le nombre
total de crabes identifiés dans le document survey
(une
simple somme de tous les crabes identifiés sur une année) ou encore un
regroupement de tous les crabes mâles dits “pre-recruits”, définis comme
des juvéniles qui ne peuvent pas être légalement pêchés.
Afin de prendre en compte l’effort de pêche qui peut varier, nous
avons divisé le nombre de crabes de chaque catégorie par le nombre de
casiers utilisés pour chaque échantillon de survey
. Nous
avons ensuite calculé pour chaque année dans un premier temps la somme
de ces valeurs pour obtenir un nombre de crabes corrigés par l’effort de
pêche puis une moyenne de crabes par casiers (per_pot
). Une
simple régression linéaire nous a permis de déterminer que ces deux
variables sont corrélées de manière très significative et ainsi que nous
pourrions utiliser l’une des deux variables sans avoir de différence
importante dans les résultats.
Dans l’optique de mieux comprendre nos données et de voir l’évolution des différents paramètres au cours du temps, nous avons procédé à quelques observations préliminaires. Cela permet de dégager les tendances observées dans nos données et ainsi de nous poser les bonnes questions puis d’y répondre à l’aide de modèles statistiques. Ci-dessous vous trouverez donc quelques graphiques représentant des données intéressantes.
La population totale de P.camtschaticus subit de fortes variations au cours du temps avec des pics importants et une décroissance critique entre 1980 et 1986, La taille des crabes, qu’ils soient mâles ou femelles, semble être en augmentation, malgré une période de diminution entre 1975 et 1978. Quand au prix des crabes à la livre, il subit une très forte augmentation à partir des années 1980, ce qui correspond à la raréfaction de la ressource due à la diminution de la population observée plus tôt sur cette période là. Enfin on remarque qu’une très grande quantité de crabe a été pêchée en 1965 mais que la quantité baisse fortement par la suite, grâce notamment à l’instauration de quotas de pêche permis par les échantillonnages cités plus tôt.
Suite à ces observations, plusieurs questions nous sont apparues.
Question 1 : Comment l’habitat du crabe royal du Kamtchatka évolue-t-il au fil du temps ?
Question 2 : Ces modifications environnementales affectent-elles la taille des crabes royaux du Kamtchatka ?
On veut donc tester si des facteurs abiotiques comme la température et la salinité des eaux au large des côtes de l’Alaska à 100 mètres de profondeur varient avec le temps. Tout d’abord visualisons ces données graphiquement :
L’objectif de notre étude est d’évaluer l’existence d’une corrélation statistiquement significative entre la température des eaux autour des îles Kodiak et les variables temporelles (année et saison), et leurs interactions potentielles. De même pour la salinité. Pour cela nous avons réalisé des analyses de la covariance (ANCOVA).
Mdèle d’analyse de la covariance (ANCOVA) avec interaction :
Pour tout \(i\) allant de 1 à 4, et \(k\) allant de 1 à 22 on suppose que \(y_{ik}\) est la réalisation d’une variable aléatoire \(Y_{ik}\) représentant la température (en °C) telle que :
\[Y_{ik} = \mu + \alpha_{i}+\beta x_{ik} + \gamma_i x_{ik} + E_{ik} ,\qquad E_{ik} \overset{i.i.d}{\sim} \mathcal{N}(0, \sigma^2)\] où:
\(Y_{ik}\) est la \(k\)-ième observation de la température à la saison \(i\)
\(\mu\) est l’intercept
\(\alpha_{i}\) est l’effet de la \(i\)-ème saison (sur l’intercept)
\(\beta\) est l’effet commun à toutes les saisons de l’année sur la température (pente de référence de la droite de régression)
\(\gamma_{i}\) est la covariable, c’est l’interaction entre la saison \(i\) et l’année (effet de la saison \(i\) sur la pente de référence)
\(E_{ik}\) est l’erreur résiduelle de la \(k\)-ième observation de la température à la saison \(i\)
\(x_{ik}\) est l’année de la \(k\)-ième observation de la saison \(i\)
Nous testons la normalité de la température pour chaque saison à l’aide du test de Shapiro :
Aucun des tests n’est significatif, l’hypothèse de la normalité de \(Y_i\) est donc validée, on peut passer à la suite.
ancova_temp_inter <- lm(temp ~ year * saison, data = celsius)
par(mfrow=c(2,2))
plot(ancova_temp_inter)
## Anova Table (Type II tests)
##
## Response: temp
## Sum Sq Df F value Pr(>F)
## year 18.610 1 19.5822 4.133e-05 ***
## saison 134.151 3 47.0519 9.141e-16 ***
## year:saison 2.091 3 0.7335 0.5361
## Residuals 57.023 60
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
On observe graphiquement que l’on a bien homoscédasticité, cette hypothèse est également validée. De plus on remarque que l’interaction entre l’année et la saison n’est pas significative, ainsi nous pouvons la retirer du modèle et formuler un nouveau modèle d’ANCOVA sans interaction.
## Anova Table (Type II tests)
##
## Response: temp
## Sum Sq Df F value Pr(>F)
## year 18.610 1 19.834 3.528e-05 ***
## saison 134.151 3 47.657 3.348e-16 ***
## Residuals 59.114 63
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
L’année et la saison on un effet fortement significatif sur la température (année : \(p-value = 3.528 \times 10^5\) et saison : \(p-value = 3.348 \times 10^{-16}\)), on garde donc ce modèle. #### Modèle final et résultats Formulation du modèle final avec les mêmes notations que précédemment :
\[Y_{ik} = \mu + \alpha_{i}+\beta x_{ik} + E_{ik} ,\qquad E_{ik} \overset{i.i.d}{\sim} \mathcal{N}(0, \sigma^2)\]
On obtient donc les estimations ponctuelles des paramètres définis plus haut :
\(\hat{\mu} = -221.73852\) / \(\hat{\beta} = 0.11589\) / \(\hat{\alpha}_{automne} = 0\) / \(\hat{\alpha}_{été} = -2.27072\) / \(\hat{\alpha}_{hiver} = -1.87579\) / \(\hat{\alpha}_{printemps} = -3.56864\)
Dans l’analyse effectuée avec R pour notre modèle, nous observons que les variables ‘année’ et ‘saison’ ont un effet significatif sur la température. Ceci est démontré par des valeurs de p faibles (pour l’année : \(p-value = 3.52810^{-5}\) et pour la saison : \(p-value = 3.348 \times 10^{-16}\)). Ces résultats suggèrent une variation saisonnière claire de la température. De plus, \(\hat{\beta}\) étant positif, cela signifie que la température est correlée positivement avec les années et de manière significative. Cette tendance pourrait être potentiellement liée au changement climatique, bien que des études supplémentaires soient nécessaires avec beaucoup plus de données pour établir une corrélation plus solide entre ces observations et le changement climatique global.
Nous formulons également un modèle d’analyse de la covariance pour la salinité :
Pour tout \(i\) allant de 1 à 4, et \(k\) allant de 1 à 19 on suppose que \(y_{ik}\) est la réalisation d’une variable aléatoire \(Y_{ik}\) représentant la salinité (en parties par milliers) telle que :
\[Y_{ik} = \mu + \alpha_{i}+\beta x_{ik} + \gamma_i x_{ik} + E_{ik} ,\qquad E_{ik} \overset{i.i.d}{\sim} \mathcal{N}(0, \sigma^2)\] où:
\(Y_{ik}\) est la \(k\)-ième observation de la salinité pour la saison \(i\)
\(\mu\) est l’intercept
\(\alpha_{i}\) est l’effet de la \(i\)-ème saison (sur l’intercept)
\(\beta\) est la pente de référence
\(\gamma_{i}\) est la covariable, c’est l’interaction entre la saison \(i\) et l’année (effet de la saison \(i\) sur la pente de référence)
\(E_{ik}\) est l’erreur résiduelle de la \(k\)-ième observation de la salinité à la saison \(i\)
\(x_{ik}\) est l’année de la \(k\)-ième observation de la saison \(i\)
Nous testons la normalité de la salinité pour chaque saison à l’aide de tests de Shapiro :
Aucun test n’est significatif, on peut ainsi valider l’hypothèse de la normalité et passer à la suite.
ancova_salinity_inter <- lm(salinity ~ year * saison, data = salinity)
par(mfrow=c(2,2))
plot(ancova_salinity_inter)
## Anova Table (Type II tests)
##
## Response: salinity
## Sum Sq Df F value Pr(>F)
## year 0.67399 1 11.5455 0.00131 **
## saison 1.69661 3 9.6877 3.498e-05 ***
## year:saison 0.16842 3 0.9617 0.41786
## Residuals 3.03558 52
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
On observe sur les graphiques du modèle que l’on a bien
homoscédasticité, cette hypothèse du modèle est également validée. De
plus l’interaction entre l’année et la saison n’est pas significative,
nous pouvons alors reformuler un modèle d’ANCOVA sans interaction dans
R
.
ancova_salinity <- lm(salinity ~ year + saison , data = salinity)
par(mfrow=c(2,2))
plot(ancova_salinity)
## Anova Table (Type II tests)
##
## Response: salinity
## Sum Sq Df F value Pr(>F)
## year 0.6740 1 11.570 0.001255 **
## saison 1.6966 3 9.708 3.062e-05 ***
## Residuals 3.2040 55
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Pour ce modèle, les résultats de la sortie R révèlent que la variable
année
a un effet statistiquement significatif sur la
salinité (\(p-value = 0.001255\)). La
variable saison
présente également un effet fortement
significatif (\(p-value = 3.062 \times
10^{-5}\)).
On garde donc ce modèle comme modèle final et on le reformule avec les mêmes notations que précédemment :
\[Y_{ik} = \mu + \alpha_{i}+\beta x_{ik} + E_{ik} ,\qquad E_{ik} \overset{i.i.d}{\sim} \mathcal{N}(0, \sigma^2)\]
On obtient donc les estimations ponctuelles des paramètres définis plus haut :
\(\hat{\mu} = 90.210403\) / \(\hat{\beta} = -0.029521\) / \(\hat{\alpha}_{automne} = 0\) / \(\hat{\alpha}_{été} = 0.206833\) / \(\hat{\alpha}_{hiver} = -0.301767\) / \(\hat{\alpha}_{printemps} = 0\)
Ces résultats suggèrent que la salinité est correlée négativement avec les années de manière significative. Cela signifie que la salinité diminue au cours du temps ce qui pourrait être une conséquence du changement climatique. En effet la fonte des glaces dans la zone d’étude est de plus en plus importante et pourrait expliquer en partie cette diminution de la salinité.
Nous souhaitons ensuite tester si la température et la salinité ont
un effet sur la longueur des crabes. Pour cela nous avons formulé un
modèle d’analyse de la variance avec deux facteurs quantitatifs
(température
et salinité
) et un facteur
qualitatif (sexe
). Nous avons également inclus une
potentielle interaction entre le sexe et la température et salinité.
Nous n’avons pas inclus l’année dans notre modèle car nous avons observé
précédemment qu’elle était fortement corrélée à la température et la
salinité et elle explique donc la même partie de la variance, nous
préfèrons ainsi un modèle plus simple.
Pour tout \(i\) allant de 1 à 2, et \(k\) allant de 1 à 407887 on suppose que \(y_{ik}\) est la réalisation d’une variable aléatoire \(Y_{ik}\) représentant la longueur du crabe (en millimètres) telle que :
\[Y_{ik} = (\mu + \alpha_i) + (\beta_1 + \gamma_{i1}) x_{ik1} + (\beta_2 + \gamma_{i2}) x_{ik2} + E_{ik} ,\qquad E_{ik} \overset{i.i.d}{\sim} \mathcal{N}(0, \sigma^2)\] où :
\(Y_{ik}\) est la \(k\)-ième observation de la longueur pour le niveau \(i\) du facteur sexe
\(\mu\) est l’intercept
\(\alpha_{i}\) est l’effet du niveau \(i\) du facteur sexe (sur l’intercept)
\(\beta_1\) est l’effet de la température sur la longueur du crabe
\(\gamma_{i1}\) est l’interaction entre le sexe et la température
\(\beta_2\) est l’effet de la salinitié sur la longueur du crabe
\(\gamma_{i1}\) est l’interaction entre le sexe et la salinité
\(E_{ik}\) est l’erreur résiduelle de la \(k\)-ième observation de la température au niveau \(i\) du facteur saison
\(x_{ik1}\) est la température de la \(k\)-ième observation du niveau \(i\) du facteur sexe
\(x_{ik2}\) est la salinité de la \(k\)-ième observation du niveau \(i\) du facteur sexe
Concernant l’hypothèse de normalité de la longueur des crabes pour
chaque sexe, nous avons un très grand nombre d’observations (329233 pour
les femelles et 407887 pour les mâles), la distribution de la longueur
tend alors à se rapprocher d’une distribution normale, c’est une
conséquence du théorème central limite. Cette hypothèse du modèle est
donc validée, on peut formuler le modèle dans R
pour cela
nous utilisons la température moyenne et salinité moyenne de chaque
année et la longueur mesurée des crabes mâles et femelles.
mod_taille_temp_sal_inter <- lm(length_mm ~ sex * (temp_moy + sal_moy), data = dstns_long)
par(mfrow=c(2,2))
plot(mod_taille_temp_sal_inter)
## Anova Table (Type II tests)
##
## Response: length_mm
## Sum Sq Df F value Pr(>F)
## sex 46933918 1 97934.60 < 2.2e-16 ***
## temp_moy 4922425 1 10271.37 < 2.2e-16 ***
## sal_moy 5146900 1 10739.77 < 2.2e-16 ***
## sex:temp_moy 1593201 1 3324.45 < 2.2e-16 ***
## sex:sal_moy 209975 1 438.14 < 2.2e-16 ***
## Residuals 341446053 712478
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
En observant les graphiques du modèle (longs à générer de par le très
grand nombre de données), on remarque que l’on a bien homoscédasticité,
on peut valider cette hypothèse du modèle. On observe dans la sortie
R
du test que plusieurs éléments sont significatifs :
l’effet du sexe sur la longueur des crabes : \(p-value = 2,2 \times 10^{-16}\)
l’effet de la température sur la longueur des crabes : \(p-value = 2,2 \times 10^{-16}\)
l’effet de la salinité sur la longueur des crabes : \(p-value = 2,2 \times 10^{-16}\)
l’interaction entre le sexe et la température : \(p-value = 2,2 \times 10^{-16}\)
l’interaction entre le sexe et la salinité : \(p-value = 2,2 \times 10^{-16}\)
On garde donc notre modèle initial sans enlever de facteur et on calcule les estimates de chaque paramètre.
##
## Call:
## lm(formula = length_mm ~ sex * (temp_moy + sal_moy), data = dstns_long)
##
## Residuals:
## Min 1Q Median 3Q Max
## -97.209 -13.466 0.301 14.750 82.941
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 796.56997 12.36594 64.42 <2e-16 ***
## sexM 386.40050 16.74998 23.07 <2e-16 ***
## temp_moy -1.04662 0.04285 -24.43 <2e-16 ***
## sal_moy -21.12123 0.38747 -54.51 <2e-16 ***
## sexM:temp_moy -3.31042 0.05741 -57.66 <2e-16 ***
## sexM:sal_moy -10.99277 0.52517 -20.93 <2e-16 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 21.89 on 712478 degrees of freedom
## (24636 observations effacées parce que manquantes)
## Multiple R-squared: 0.151, Adjusted R-squared: 0.151
## F-statistic: 2.534e+04 on 5 and 712478 DF, p-value: < 2.2e-16
On obtient donc les estimations ponctuelles des paramètres définis plus haut :
\(\hat{\mu} = 796,56997\) / $_{femelle} = 0 $ / \(\hat{\alpha}_{mâle} = 386,40050\) / \(\hat{\beta_1} = -1,04662\) / \(\hat{\beta_2} = -21,12123\) / \(\gamma_{i1} = -3,31042\) / \(\gamma_{i2} = -10,99277\)
Nous pouvons en conclure que la longueur des crabes dépend de manière significative du sexe du crabe, cela confirme que l’on a un dimorphisme sexuel comme supposé en introduction. De plus la longueur des crabes est correlée négativement à la température moyenne annuelle de l’eau et à la salinité moyenne annuelle à 100 mètres de profondeur (de manière significative). Cela suggère que les crabes se développeraient moins bien ou atteindraient des tailles plus faibles lorsque la température et la salinité sont élevées. On pourrait l’expliquer par la modification négative de leur environnement lors de l’augmentation de ces facteurs abiotiques (qui peut être du au changement climatique), pouvant avoir un impact sur la disponibilité des ressources (proies par exemple). Cette réduction de la taille pourrait également être expliquée par un métabolisme des crabes moins efficace en sortant de certaines conditions environnementales ou encore que le développement des larves de crabes est impacté par cela et aurait des effets sur le long terme.
Le changement climatique est un problème majeur de notre siècle, dont l’origine anthropique est désormais prouvée. L’augmentation des températures des océans en fait partie et impacte grandement l’écologie des espèces marines. C’est pourquoi, dans cette étude, nous avons voulu montrer que les îles Kodiak sont également touchées par ce changement des conditions abiotiques et qu’elles ont un impact sur P.camtschaticus, une ressource importante pour la pêche dans cette zone.
La première partie de notre étude a clairement montré une augmentation significative des températures au cours des années et avec des variations au cours des saisons et une diminution significative de la salinité de cette zone entre 1973 et 1986.
C’est pourquoi nous avons ensuite cherché à observer si ces modifications ont un impact significatif sur la taille des crabes. Nous avons alors pu démontrer que la longueur des crabes est correlée de manière significative à la température et la salinité moyenne annuelle ainsi que cette longueur dépend de manière significative du sexe du crabe.
Il est intéressant de noter que les observations ont été faites il y a 40 ans ou plus, et que la situation a probablement beaucoup évolué depuis. Il serait donc intéressant de continuer la les échantillonnages et de les comparer. De plus, nous n’avons pas abordé ici l’impact de la pêche qui peut être très intéressant. C’est un problème multifactoriel qui nécessite plus d’approfondissement pour être compris et pour permettre une conservation du milieu et de cette espèce.
Malheuresement il aurait fallut plus de données pour la température et la salinité afin d’avoir un modèle plus puissant et ainsi des résultats plus robustes.
Il serait utile d’ajouter le district comme variable supplémentaire dans nos analyses de covariance portant sur la température et la salinité, afin d’examiner si certains secteurs sont plus ou moins influencés par les courants autour de l’île.