col1 col2
1 0 10
2 1 11
3 2 12
4 3 13
5 4 14
6 5 15
Prof. Maurício Garcia de Camargo. IO-FURG.
2025-10-31
Você certamente já sabe:
Linhas e colunas de qualquer tipo de dado (numéro ou texto)
data.framedata.frame(vet1,vet2,vet3)
Extrair elementos do DF (linha,coluna):
col1 col2 nova_col
1 0 10 A
2 1 11 B
3 2 12 C
4 3 13 D
5 4 14 E
6 5 15 F
col1 col2
5 4 14
6 5 15
Variáveis categóricas são chamadas de fatores (factors) no R, e as categorias são chamadas de níveis (levels).
[1] "Pré-adol" "Pré-adol" "Pré-adol" "Adol" "Adol" "Adol"
col1 col2 nova_col fator
1 0 10 A Pré-adol
2 1 11 B Pré-adol
3 2 12 C Pré-adol
Para o exercício 1, você vai usar o pacote readxl, que não vem com o R base.
O pacote pode ser usado de 2 maneiras, após acertar o WorkDir:
Assim:
library(readxl)
plan = read_excel('plan1.xlsx')
Ou…
plan = readxl::readexcel('plan1.xlsx')
1.1. Baixe a planilha 1 (plan1.xlsx) na página da disciplina.
1.2. Armazene esta planilha num objeto tipo dataframe chamado dados usando o pacote readxl.
Lembre-se de acertar o WorkDir usando o menu Session>Set Working Directory.
1.3. Crie 3 novos dataframes a partir de dados:
- fat (local e estacao)
- abio (sal, temp e pH)
- bio(sp1, sp2 e sp3)
1.4. Crie uma nova coluna no dataframe dados chamada abund correspondente à abundância total das espécies em cada amostra.
1.5. Crie uma nova coluna chamada riqueza contendo a riqueza de espécies, ou seja, o número de espécies em cada amostra.
1.6. Crie um novo dataframe chamado indices contendo os novos índices de abundância e riqueza recém criados.
1.7. Extraia as médias de salinidade para cada local.
Sugestão: crie um filtro para cada local e extraia as médias individualmente.
1.8. Extraia as médias de temperatura para cada estação.
TEM QUE HAVER FORMA MAIS AMIGÁVEL DE FAZER ISSO!
aggregate() resume uma ou mais colunas por grupos.
Exemplos de perguntas que ela resolve:
aggregate()Existem várias maneiras de montar os argumentos da função.
A forma mais poderosa é usando as fórmulas do R:
onde:
variavel: o que será resumido (ex.: Temp)
grupos: por quem será agrupar (ex.: Local, ou Local + Estacao)
data: o dataframe que será resumido FUN: função de resumo (ex.: mean, sum, length, sd)
dadoso R junta todas as linhas de cada local e calcula a média.
dadosQuando tem várias variáveis para resumir juntas (Temp, Sal, pH), se usa outro formato da aggregate():
Onde:
dados[, c(…)] → quais colunas serão resumidas;
by = list(…) → por quem serão agrupadas;
FUN = mean → função do resumo.
2.1 Abra a planilha limno.xlsx na página da disciplina.
2.2.Armazene esta planilha num objeto tipo dataframe chamado dad usando o pacote readxl.
2.3. Crie 3 novos dataframes a partir de dad:
- fat (ponto, estacao e setor)
- abio (temp, pH, etc)
- bio(Bosmina, Bosminopsis, Calanoida, etc)
2.4. Crie uma coluna para a abundância total por amostra.
2.5. Separe uma planilha para cada estação do ano.
2.6. Extraia a média da abundância da combinação de estacao e setor.
