現地時間2024年12月16日(月)、午前7時半に起きた。朝、家を出て、専門学校へ向かった。
先週に引き続き、グループプロジェクトに取り組んだ。データを整理するのが、私の役割だ。グループのほかのメンバー2人は、データの分析と可視化を担当する。
分析や可視化を始めるうえで、データの整理は欠かせない。ほかのメンバーが作業を開始できるよう、私は担当分の作業をなるべく早く終える必要があった。Pythonを使ってデータを処理し、整理済みのデータを今日の朝までにグループメンバーと共有した。
だが実際には、作業が完了していなかった。先生が問題点に気付いたからだ。データのなかに重複している値があり、私はその部分を適切に削除したつもりだったが、先生は削除方法について改善したほうがよいと指摘してくれた。私は指摘に従って修正し、今日の昼、ようやく担当分の作業を完了させた。
重複している値の削除は、データ分析において重要な作業だ。その後の過程に影響するし、不正確な結論を導きかねない。ほかのグループメンバーは私のミスに気づかなかった恐れがあり、先生からの助言はとてもありがたかった。
On Monday, December 16th, 2024, I got up around 7:30 a.m. PST and left home in the morning for college.
Following last week, I worked on a group project. I’m responsible for cleaning the data prepared by the teacher, while the other two members focus on analyzing and visualizing it.
Since data cleaning is essential for analysis and visualization, I needed to complete my task as soon as possible. Using Python, I processed the data and shared the organized version with my group members before this morning.
However, my task was not actually complete, as the teacher pointed out an issue in my work. He told me that I needed to improve the way I removed duplicate data. Following his instructions, I revised the process and eventually completed my task.
Removing duplicates is a crucial step in data analysis, as it can affect subsequent processes and lead to incorrect conclusions. I appreciate the teacher’s advice, as my group members might not have noticed the issue with my duplicate removal process.