合肥生活安徽新聞合肥交通合肥房產生活服務合肥教育合肥招聘合肥旅游文化藝術合肥美食合肥地圖合肥社保合肥醫院企業服務合肥法律

        代寫 MATH1041 Statistics for Life

        時間:2024-07-18  來源:合肥網hfw.cc  作者:hfw.cc 我要糾錯


        MATH1041 Statistics for Life and Social Sciences

        Term 2, 2024

        MATH1041 Assignment

        Data:  Together with this document, you should have received your unique dataset in an e-mail sent to your  official university email address. The data (i.e., your dataset) is available in a text file with the name 5**4**8.txt. If you have not received your dataset (double check your UNSW email inbox and the spam folder), please contact  your lecturer.

        Submission due date:  Tuesday 23rd July (Week 9) before 11:59 PM (Sydney time, AEST). Note a late penalty of 5% of the maximal possible mark per day will apply. No assignment will be accepted more than five days after the deadline.

        Your submission must contain your full name and student zID at the top of the first page of your assignment. Submit your assignment through Turnitin via Moodle.  See the “Assessments Hub” section on Moodle for further  information regarding online submission.

        Please submit a neatly typed assignment as a Microsoft Word document (.doc or  .docx), see the information and help about the assignment in the assessment section on Moodle, or as a PDF document (.pdf) created for instance using Google Docs, LATEX, RMarkdown or similar tools.  For your convenience, there is a  Microsoft Word template that can be downloaded from Moodle which you can write your assignment in, that is  already in a format appropriate for this assignment.

        Verify your assignment has been submitted correctly by downloading the submission receipt and clicking on the link to check it displays correctly in the Turnitin viewer. If not, it is your responsibility to make the necessary amendment.

        Typesetting (*)

         

        /2

        Q1

         

        /14

        Q2

         

        /16

        Q3

         

        /16

        Q4

         

        /6

        Q5

         

        /19

        Total

         

        /**

        (*) See the next pages and the “Assessments Hub” on Moodle for details, help and explanations about the assignment and typesetting.

         

        Assignment format

        Keep in mind this assignment is not only about assessing your Statistical skills; it is also about giving you feedback on your Mathematical writing skills.  The assignment must be typeset correctly and provide complete but concise explanations in complete English sentences and paragraphs. Think of this as practice for a document you might produce in your future studies or career that includes mathematical explanations.

        Here are some more details that may assist you:

        •  Regarding the overall assignment structure, please answer all questions in the given order (that is, 1.a., 1.b., ... etc).  Do not re-write the assignment questions again, only their label (write “3.e.” for instance when you start question 3.e.).  Keep your answers brief, clear and concise.

        DO NOT reproduce the cover sheet, i.e., the first 5 pages of the pdf file sent to you, in your assignment.

        •  Start your answer to each Question (1, 2, etc.)  on a new page. Each Question should start on a new page, but sub-parts of a Question (such as Question 3.d., 3.e.)  should continue on the same page.

        •  If you do include any R-code, it should be typed in a different colour and/or font.

        •  You are required to type up your entire assignment (in Microsoft Word, Google docs, LATEX, Overleaf or RMarkdown) including any equations.  The only exception are the plots produced by  RStudio, for which you can save the figures (use “export” in the bottom right window in RStudio) which you then paste in your assignment.  Nothing can be handwritten then scanned. As a UNSW student, you can download Microsoft Word for free, see: https://www.myit.unsw.edu.au/software-students.

        •  As in any properly typeset document containing mathematic symbols, you must use an equation editor for all maths symbols.  For instance, you should write “X is normal”, rather than “X is normal” (Notice

        how the ‘X’ looks different?)  and you should write “tobs  = 1.23”, rather than “tobs = 1.23”.

        The marking scheme for this criterion is the following:  Are  mathematical symbols typeset using the equation editor?  2 marks for ‘almost always’, 1 mark for ‘sometimes’, 0 mark for ‘rarely’.

        Help about Microsoft equation editor can be found in a document called Microsoft Word Equation editor help for MATH1041 located on Moodle in the Assignment (20%) section within the Assessments Hub section of the MATH1041 Moodle page.

        •  You should add some working out for the questions involving calculations; do not just give the final answer. Note that you may get partial marks for clear explanations and a correct method even if you get the wrong  answer.  However, try to keep your solutions brief and concise.  Depending on what the question is asking, your working out could consist of RStudio  commands, a formula, or perhaps the main steps explaining  how you arrived at your answer. You do not need to add all your R-code.

        •  Keeping your results to 3 or 4 significant figures should be fine. If there are multiple steps in a calculation, do not round any numbers until you have reached the final step.  To help you do calculations correctly in  RStudio without rounding, values should be stored as variables, rather than copying the output number  into a further calculation.  For example, if you are constructing a confidence interval and need to calculate t* , you should write the code:  tstar  <-  qt(0.975,  df  =  10) and then use the variable tstar in calculating  your confidence interval, rather than pasting in the number 2.228139.

        •  There is no requirement for font size and line spacing but please make sure your assignment is readable — do not make the font size too small or the spacing too compact.

        •  If the question asks you to produce a graph/plot, you should always include that graph in your answer, unless otherwise specified.

         

        Scenario

        During 2022, when COVID-19 was present, Dr Lafayellis lectured

        BIOL2**, a course for second-year Biology students at Kensington University in Sydney.  They asked the students in the course to fill in a survey:

        (The variables are in alphabetical order.  What you see on the right of this page is an excerpt of the answers to the survey.)

        •  accomodation: What are your living arrangements?

        1 = I live with my parents/family, 2 = I live with roommates, 3 = I live alone

        •  age: Your age in years?

        •  anxiety:  Dr Lafayellis had put in the survey a series of state- ments like  ‘I overreact to situations’ or  ‘I find it hard to calm  down’ or  ‘even  if something  bad  happens  to  me,  I rarely feel  fear or anxiety’ and asked the students to choose between  ‘very  false for me’,  ‘somewhat false for me’,  ‘somewhat true for me’ and  ‘very true for me’.  They used these answers to calculate a  anxiety score for each student, which is a number between 1 and 5, where 5 corresponds to extremely anxious.

        •  ATAR: What was your ATAR? If you did not get an ATAR, because you studied at a Greek or Chinese high school for instance, then enter NA for ‘Not Applicable’.

        Background information: At the end of high school, students in NSW (New South Wales) take the HSC (High School Certificate) at the end of which they are granted an ATAR  (Australian Tertiary Admissions Rank), which is a number between  0 and 100.  The ATAR  determines a student’s entry into Australian universities.

        •  Engl1st: Is English your first language? 1 = yes, 2 = no.

        •  gender: What is your gender?

        F = Female, M = Male, O = Other or ‘Prefer not to say’.

        •  highschool: What type of high school did you attend?

        1  = Australian public school,  2  = Australian private school, 3 = Australian selective school and 4 = non-Australian high school (that is a high school which does not follow an Australian curriculum, like a high school in China for example).

        •  job:  Do you have a job in parallel to university?

        1 = No; 2 = Yes, part-time job, less than 20 hours per week; 3 = Yes, part-time job, 20-34 hours per week; 4=Yes, full-time job, 35 hours per week or more.

        •  politorient: Which Australian political party has your preference?  1 = Liberal, 2 = Labor, 3 = Other.

        •  SES: How would you describe your family’s socioeconomic status on a scale of 1 to 5 where 1 = High and 5 = Low?

        •  WAM: From the Kensington University database, Dr Lafayellis had found the Weighted Average Mark (WAM) of each student, which is a number between 0 and 100 calculated using the final marks obtained by that student in all the previous courses they have taken at Kensington University.

        At that point, Dr Lafayellis had a table with one row per student and columns corresponding to the variables described above (they deleted the column with the names for anonymity purposes).

        Some students did not answer, and among the students who did answer, a few students have left some fields blank.  These show as NA in the dataset.

        Two of Dr Lafayellis’ BIOL2** students, Dani and Xiao, are also taking a Statistics course called MATH1041, and they ask Dr Lafayellis for the results of the survey.  Dr Lafayellis provides them with the dataset 5**4**8.txt, which you have received by email. Your job is to assist Dani and Xiao by analysing the dataset provided to you. The data has been sent to you in a separate text file attachment sent by email.  An excerpt of (a portion of) it  was on the right of the previous page.

        Reading the data into RStudio

        The data are in a text file with the name 5**4**8.txt.  This file was sent to you by e-mail (see page 1).

        The first step is to read the data into RStudio. The data format is similar to what you have already done in the   Weekly Mobius lessons.  Follow the instructions given in section R1.4 “How to import a text file into RStudio ” of the RStudio “How-To-Manual” available on Moodle.  Once you have uploaded the data then you are ready to   start your analysis!

        To make sure everything is all right, please check the values calculated from your file 5**4**8.txt match the values given below.

        Note you may need to add the argument na.rm  =  TRUE to remove non available (i.e., missing) values. ##  mean  anxiety  =    2 .096931   ,    mean  age  =     21 .58  ,    mean  WAM  =    ** .08899

        They match? It means you imported the data correctly in RStudio. You are ready to start!  (Note that print(x, digits  =  9) would allow you to set to 9 the number of significant digits to display for the variable x.)

         

        The Analysis Tasks

        The questions you need to answer in your assignment submission are given below.

        Q1. Dani and Xiao decide to start by exploring the data.

        1.a. Is it an observational study or is it an experiment?  Provide a brief justification for your answer.

        1.b.  Check the sample mean of the ATAR of the students in your dataset is 83.2751807  (we are giving you this value as one last check you are using the correct dataset, correctly imported).

        If this is the case, calculate the standard deviation of the ATAR of the students in your dataset.

        1.c.  Dani is impatient to compare their ATAR to the ATAR of their BIOL2** classmates, and without waiting or thinking any further, Dani gets started on calculations.

        Dani got an ATAR of 86.  Calculate Dani’s z-score (the standardised value corresponding to their ATAR) and explain in a full sentence what this number is for Dani’s ATAR in relation to the ATAR of their classmates.

        1.d.  Dr Lafayellis, who is keeping an eye on what Dani and Xiao are doing with the data, looks at Dani’s ATAR calculations and says:  “Calculating the standard deviation and your z-score should not have been your first step.”  They smile and adds “In fact, I know for sure you can discard some of the values in data because they are wrong.”

        Write, in no more than one sentence, what should Dani have done before computing any numerical summary to check if any of the data are non-sensical and should be removed?

        (N.B. You are not required to do it, just say what Dani should have done).

        1.e. Xiao lives with their parents and Dani wonders if this is the exception or the rule.

        To find out, using the data provided in the file 5**4**8.txt which was shared with you, Dani runs the following R-code and obtains the graph below.

         

        counts <- table(survey$accomodation, survey$Eng1st) barplot(counts, main = "Living arrangements by First language", names.arg = c("English as \n First language","English as \n Second language"), col = c("royalblue","indianred", "orange"), beside = TRUE) legend(5, 55, legend = c("live w. parents", "live w. roomates", "live alone"), fill = c("royalblue","indianred", "orange"), cex = 1)

         

         

        Dani looks at the graphical summary produced by R and exclaims:  “My graph shows the most common living arrangement for Kensington University students, whether English is their first language or not, was to live with their parents”.

        Xiao says:  “No, what you have done does not prove that. It may be true, but your graph does not prove it, no matter what your graph looks like.”

        Explain, in no more than three sentences, why Xiao is correct.

        1.f. Xiao suspects there is a relationship between gender and political  preferences.  Create a properly labelled graphical summary of the political orientation of students by gender.  The graph should be self contained:  someone who would see just the graph should be able to understand it without any extra information.  Hence, please include a legend for the graph.

        1.g.  Describe at least two differences or similarities in the political preferences among students depending on their gender using your graph from Part 1f.

        Your answer should be no more than two sentences. 

        With the markers in mind, in your assignment, please start every question on a new page.

        Q2 WAM by type of high school attended

        In this question, we study the WAM by type of high schools the students attended.  Note we are still in the exploration phase, so you must still use the dataset which was given to you in its original form.  Do NOT modify it at this stage.

        2.a. What is the explanatory variable? Is it a categorical or quantitative variable? 2.b. What is the response variable? Is it a categorical or quantitative variable?

        2.c.  Produce properly labelled comparative (i.e., parallel/side by side) boxplots for WAM by type of school. Your graph should be self contained:  someone who would see just the graph should be able to  understand it without any extra information.

        2.d.  Describe any differences or similarities in the distribution of  WAM among students depending on the type of school they attended, using your comparative boxplots from Part 2c.  Include in your answer comments on shape, location and spread. Indicate what aspect of the boxplots each of your conclusion(s) is based on (we need to know what exactly you looked at). Your answer should be no more than four sentences.

         

        2.e.  By looking at the comparative (i.e., parallel/side by side) boxplots from Part 2c for WAM by type of school, Xiao notices on average, students from Australian high schools (i.e., high schools which teach the curriculum from New South Wales or Victoria or Queensland . . .  etc) seem to be doing better in terms of WAM than students who did their high school in a non-Australian high school (meaning they teach a foreign curriculum).

        Identify a confounding variable for the exploration of the WAM by type of school using comparative (i.e., parallel/side by side) boxplots from Part 2c, and explain why it is confounding (make sure you explain why the variable you are mentioning satisfies all the required conditions to be considered a counfoundig variable according the definition of a confounding variable).

        Your answer should be no more than four sentences. 

        With the markers in mind, in your assignment, please start every question on a new page.

        Q3 Relationship between ATAR and WAM

        Admission to Kensington University, like for all universities in New South Wales, is in most cases based on a student’s ATAR. Xiao wonders if the ATAR a student gets at the end of high school is a good predictor of the WAM a student will get later on at university.  On one hand, Xiao thinks it may, because both the ATAR and the WAM measure academic performance but on the other hand, they suspect there are essential differences between high school and universities and the fact the ATAR and the WAM could be calculated using different subjects (some students studied mostly humanities, other students studied mostly STEM subjects) may come into play.  Therefore, rather than speculate, Xiao decides to investigate based on the data at their disposal. As usual, the first step is to explore the data.

        3.a.  Produce an appropriate graphical summary to visualise the relationship between ATAR and WAM (the goal at this early stage is to explore the data in your dataset so use the raw data you were given to produce your graph.  Do NOT alter it in any way).  DO NOT include this graph in your assignment, it is just meant to help you answer the question below.  The plot does not attract marks.

        •  Do you notice some problematic observations in the plot you just produced in Part 3a?  If so, comment on this in your report.

        •  Explain why it is justified to remove these problematic values from the dataset.

        Now you have done the exploration in Part 3a, remove the problematic values from your dataset.

        To make sure everything is all right, please check the values calculated from your file 5**4**8.txt after removing the problematic rows match the values given below:

        •  mean WAM after the rows with problematic ATAR values have been removed is equal to **.3****

        •  standard deviation of WAM after the rows with problematic ATAR values have been removed is equal to 6.4430928

         

        They match? It means you are ready to go on!

        3.b.  Now you have removed the problematic values, produce an appropriate graphical summary to visualise

        the relationship between ATAR and WAM. Include this plot in your assignment, properly labelled.

        3.c.  Summarize the key features of your plot from Part 3b.

        Your answer should be no more than three sentences though one sentence should suffice. 3.d.  Calculate r2 , the square of the Pearson coefficient of correlation between ATAR and WAM.

        3.e. In plain English, interpret the numerical value of r2  you calculated in Part 3d. Your answer should be no more than one sentence.

        3.f. When Dani took the HSC, they got an ATAR of 86.  Their current WAM is **.  Dani wonders how the WAM predicted from their ATAR using the least-squares regression line compares to the WAM they actually have.

        Using the least-squares regression line, calculate the predicted WAM for Dani based on his ATAR.

        Tip: Use the R function lsfit() (Least Squares fit). You MUST include in your answer the value of the intercept and slope for the least-squares regression line.

        3.g.  Using the least-squares regression line calculated in Part 3f, calculate the residual corresponding to Dani’s ATAR and WAM.

        3.h.  Describe what the residual calculated in Part 3g means in a sentence in plain English (no technical terms).

        Q4.   INFERENCE: Two-sided confidence interval for the population WAM

        In this question, we will produce a two-sided confidence interval for the population WAM. Unlike in Q3, where we were dealing with ATAR values, there is no issue in the WAM values, so there is no reason to remove  rows from the original dataset 5**4**8.txt, so please, switch back to the original dataset you were given.

        Below are a few values to help you check you are using the correct dataset:

        ##  mean  anxiety  =    2 .096931   ,    mean  age  =     21 .58  ,    mean  WAM  =    ** .08899

        4.a.  Produce a 92% two-sided confidence interval for μW , the true mean WAM. For this question you may assume it is appropriate to use a t-distribution.  Make sure you write down all the required steps to calculate this interval.

        4.b.  Like all realised confidence intervals, your two-sided confidence interval constructed in Part 4a is of the form      estimate ± margin of error.

        Does the margin of error you calculated include errors due to practical problems like non-response to the survey?  (Recall that not all students answered the survey.)

        Your answer should be no more than one sentence.

        4.c.  Dani and Xiao want to mention the above two-sided confidence interval in a university help FORUM post.   In their post, they write  there  is  a  92% probability  the  true  average  WAM  of students  at Kensington  University is within . . . .  and . . . .  (the  endpoints  of your two-sided confidence  interval) .

        Dani  and Xiao  have  correctly  reported the  numerical values  for the  endpoints  of the two-sided confidence interval but Dr Lafayellis nevertheless wants them to modify this sentence in the post.

        Give at least two reasons why the statement made by Dani and Xiao is inaccurate.  (You are not required to correct the statement, you only need to explain what is wrong about it.)

        Your answer should be no more than two sentences.

         

         

         

        請加QQ:99515681  郵箱:99515681@qq.com   WX:codinghelp

         

        掃一掃在手機打開當前頁
      1. 上一篇:代做DPBS1120 、代寫c/c++,Java程序語言
      2. 下一篇:代做MP1: Image Transform、C++語言編程代寫
      3. 無相關信息
        合肥生活資訊

        合肥圖文信息
        挖掘機濾芯提升發動機性能
        挖掘機濾芯提升發動機性能
        戴納斯帝壁掛爐全國售后服務電話24小時官網400(全國服務熱線)
        戴納斯帝壁掛爐全國售后服務電話24小時官網
        菲斯曼壁掛爐全國統一400售后維修服務電話24小時服務熱線
        菲斯曼壁掛爐全國統一400售后維修服務電話2
        美的熱水器售后服務技術咨詢電話全國24小時客服熱線
        美的熱水器售后服務技術咨詢電話全國24小時
        海信羅馬假日洗衣機亮相AWE  復古美學與現代科技完美結合
        海信羅馬假日洗衣機亮相AWE 復古美學與現代
        合肥機場巴士4號線
        合肥機場巴士4號線
        合肥機場巴士3號線
        合肥機場巴士3號線
        合肥機場巴士2號線
        合肥機場巴士2號線
      4. 幣安app官網下載 短信驗證碼 丁香花影院

        關于我們 | 打賞支持 | 廣告服務 | 聯系我們 | 網站地圖 | 免責聲明 | 幫助中心 | 友情鏈接 |

        Copyright © 2024 hfw.cc Inc. All Rights Reserved. 合肥網 版權所有
        ICP備06013414號-3 公安備 42010502001045

        主站蜘蛛池模板: 国精产品一区一区三区| 久久久久人妻精品一区二区三区| 国产在线无码视频一区| 亚洲中文字幕丝袜制服一区 | 日韩精品一区二区三区中文版| 中文字幕一区二区人妻性色| 日本中文一区二区三区亚洲| 好吊妞视频一区二区| 日韩成人无码一区二区三区| 色婷婷一区二区三区四区成人网 | 福利一区二区三区视频午夜观看| 在线精品视频一区二区| 精品亚洲AV无码一区二区| 无码AV中文一区二区三区| 久久久久成人精品一区二区| 亚洲日韩精品一区二区三区无码 | 99国产精品一区二区| 精品一区二区三区视频| 国产日韩AV免费无码一区二区| 中文字幕不卡一区| 一区二区三区四区在线播放 | 亚洲中文字幕一区精品自拍| 国产经典一区二区三区蜜芽| 国产福利一区二区三区| 精品国产一区二区三区色欲| 天堂Av无码Av一区二区三区| 精品无码国产一区二区三区51安| 激情无码亚洲一区二区三区| 精品午夜福利无人区乱码一区| 国产精品电影一区| 日本在线电影一区二区三区 | 日韩人妻精品一区二区三区视频| 无码人妻精品一区二区三区东京热 | 日韩精品一区二区三区老鸭窝| 国产精品视频分类一区| 国产成人精品一区二区A片带套| 精品女同一区二区三区在线 | 麻豆精品人妻一区二区三区蜜桃| 日韩一区二区三区在线 | 亚洲av日韩综合一区二区三区| 成人免费视频一区二区三区|