반응형
3주차에 지니뮤직에서 크롤링을 하면 저스틴비버의 peaches 앞에는 19금이라는 딱지가 별도로 붙어있어 크롤링이 깔끔하게 나오지 않는 현상이 있었다.
지난주에도 <span>이 이러한 공백을 만들고, 크롤링하면서 태그를 지우려면 .decompose를 사용해야한다는 부분까지는 접근을 했었다. 그러나 당시엔 저스틴비버의 노래만 조건을 추가하여 지우는 방법을 몰랐었다.
같이 코딩공부를 하는 분들도 동일한 문제를 겪고있었고, 해결방법으로 decompose와 .strip()이 나오는것 까지는 동일했다. 이후 튜터쌤이 알려주신 코드덕분에 if 구문을 사용하는 방안을 떠올렸고, 비록 strip()을 이용해 19금 딱지를 없애는데는 실패했지만 .dcompose를 이용해 19금이 들어간 <span>을 지우는데에는 성공했다.
결국 5주차에 들어서야 문제를 해결했다. 역시 코딩은 모를땐 인터넷이든 단톡이든 어딘가에 물어봐야 해결이 되나보다.
반응형